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VORWORT 


Das vorliegende Buch beginnt mit dem Satz: „Die Wahrscheinlichkeitsrechnung 
ist ein Teilgebiet der Mathematik, das sich damit befaßt, die Gesetzmäßigkeiten 
unter den zufälligen Ereignissen aufzudecken und zu untersuchen.‘‘ Doch wäre 
man noch vor einigen Jahrzehnten kaum geneigt gewesen, diesen Satz für 
akzeptabel (oder gar für evident) zu halten, weder seitens der Mathematiker 
noch seitens der Forscher, die sich der Wahrscheinlichkeitsrechnung bedient 
haben. Erst in den zwanziger und dreißiger Jahren unseres Jahrhunderts wurden 
das Wesen der Wahrscheinlichkeitsrechnung als eines Zweiges der Mathematik 
erkannt und die Beziehungen zwischen den Begriffen der „Wahrscheinlichkeit‘ 
und der „Häufigkeit“ zufälliger Ereignisse geklärt. In 1.3. wird der Leser in 
einer umfangreichen (aber sicher unvollständigen) Liste Namen von Forschern 
finden, deren Beiträge für das Gebiet der Grundlagen der Wahrscheinlichkeits- 
rechnung wichtig sind. Jedoch sollte die besondere Bedeutung der ‚Theorie 
Analytique des Probabilites“ von LArLAce, der „Wahrscheinlichkeit, Statistik 
und Wahrheit“ von v. Mises und der „Grundbegriffe der Wahrscheinlichkeits- 
rechnung“ von KoLMoGoRoFF besonders hervorgehoben werden. Jedes dieser 
drei Werke leitete jeweils einen neuen Abschnitt in der Geschichte der Wahr- 
scheinlichkeitsrechnung ein. Darüber hinaus haben die Arbeiten der Steinhaus- 
schen Schule der unabhängigen Funktionen sehr viel zur Klärung der Grund- 
begriffe der Wahrscheinlichkeitsrechnung beigetragen. 

Der Fortschritt auf dem Gebiet der Grundlagen der Wahrscheinlichkeits- 
rechnung sowie die Einführung der Thecrie der charakteristischen Funktionen 
begünstigten die ungewöhnlich rasche Entwicklung der modernen Wahrscheinlich- 
keitsrechnung. Im Bereich der Grenzwertsätze für Summen von unabhängigen 
Zufallsvariablen wurde eine sehr allgemeine Theorie entwickelt (CmiwtscHin, 
Lüvy, KOLMOGOROFF, FELLER, GNEDENKO u. a.), während für abhängige Zufalls- 
variable einige wichtige Teilergebnisse gewonnen wurden (BERNSTEIN, MARKOFF, 
DOoEBLIN, KOLMOGOROFF u. a.). Darüber hinaus wurde die Theorie der stochasti- 
schen Prozesse zu einem exakten mathematischen Zweig der Wahrscheinlichkeits- 
rechnung (MARKOFF, CHINTSCHIn, L£vy, WIENER, KOLMOGOROFF, FELLER, 
CRAMER, DOOB u. a.). 

Manche Ideen der Anwendung der Wahrscheinlichkeitsrechnung, die heute in 
der mathematischen Statistik ihren Niederschlag finden, gehen auf Bayes 
(Theorie der Schätzungen), LarLaceE (Qualitätskontrolle von Arzneimitteln) und 
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Gauss (Fehlerrechnung) zurück. Doch erst in unserem Jahrhundert wurde die 
mathematische Statistik zu einem eigenständigen Gebiet der Wissenschaft. Um 
nur einige der wichtigsten Persönlichkeiten zu nennen, denen diese Entwicklung 
zu verdanken ist, erwähnen wir K. Pzarson, R. A. Fıster, J. Neyman und 
A. Warp, deren Ideen und systematische Forschungen sehr viel zu dem hohen 
Eintwieklungsstand der modernen mathematischen Statistik beigetragen haben. 

Gegenwärtig schreitet die Entwicklung der Wahrscheinlichkeitsreehnung und 
der mathematischen Statistik sehr intensiv voran. Einerseits ziehen bisher un- 
gelöste Probleme der klassischen Wahrscheinlichkeitsrechnung die Aufmerksam- 
keit auf sich, andererseits werden große Anstrengungen unternommen, um sehr 
weitgehende Verallgemeinerungen alter Begriffe zu gewinnen, insbesondere 
durch Betrachtung der Wahrscheinlichkeitsrechnung in allgemeineren als den 
üblicherweise betrachteten endliehdimensionalen euklidischen Räumen. Wie eng 
die Wahrscheinlichkeitsrechnung gegenwärtig mit anderen Teilgebieten der 
Mathematik verknüpft ist, geht vor allen Dingen daraus hervor, daß fast 
unmittelbar nach der Formulierung der Theorie der Distributionen durch 
L. ScHWArTz und J. MIKUSINSKI die zugehörigen wahrscheinlichkeitstheoretischen 
Gegenstücke gründlich erörtert wurden (GELFAND, Irö, UrBaAnık). Darüber 
hinaus sind Wahrscheinlichkeitsrechnung und mathematische Statistik nicht 
mehr nur einfach „Kunden“ anderer Teile der Mathematik. Im Gegenteil, die 
gegenseitige Beeinflussung und Durchdringung von Wahrscheinlichkeitsrechnung 
und mathematischer Statistik und anderen Gebieten der Mathematik schreitet 
rasch voran. Ein Beispiel dafür ist die Beziehung zwischen der analytischen 
Zahlentheorie und der ‚Wahrscheinlichkeitsrechnung (BoREL, CHINTSCHIN, 
Lınnik, Erpvös, Kıc, Renyi u.a.), ein anderes die Anwendung der Spieltheorie 
in der mathematischen Statistik und umgekehrt deren stimulierender Einfluß auf 
die Spieltheorie (v. NEUMANN, MORGENSTERN, WALD, BLACKWELL, KARLIN u. a.). 

Die Anwendungsgebiete der Wahrscheinlichkeitsreehnung und der mathe- 
matischen Statistik erweitern sich ständig. Statistische Verfahren werden heute 
vielfach im Physik, Biologie, Medizin, Ökonomie, Industrie, Landwirtschaft, 
Fischereiwesen, Meteorologie und im Verkehrswesen angewandt. Die statistische 
Methodologie wurde zu einer wichtigen Komponente der wissenschaftlichen 
Schlußweise und zu einem untrennbaren Bestandteil einer gut organisierten Arbeit 
in Betrieben und Institutionen. 

Die Entwicklung von Wahrscheinlichkeitsrechnung und mathematischer 
Statistik sowie ihrer Anwendungen äußert sich in einer ständig wachsenden Flut 
wissenschaftlicher Veröffentlichungen. 

Nach diesem kurzen Überblick über die Stellung der modernen Wahrscheinlich- 
keitsrechnung und mathematischen Statistik möchte ich nun auf das Haupt- 
anliegen des vorliegenden Buches eingehen; es stellt sich folgende Aufgaben: 


1. Darbietung einer systematischen Einführung in die moderne Wahrscheinlich- 
keitsrechnung und mathematische Statistik. 
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2. Vermittlung einer Vorstellung von der Vielfalt der möglichen Anwendungen 
dieser Theorien, untermalt durch anschauliche konkrete Beispiele. 

. Ausführliche (wenn auch nicht erschöpfende) Bezugnahme auf andere Bücher 
und Arbeiten, meist mit kurzen Angaben über deren Inhalt, um so dem Leser 
die Vervollständigung seines Wissens über die betrachteten Gegenstände zu 
erleichtern. 


w 


Trotz aller Sorgfalt, die darauf verwandt wurde, das Buch mathematisch 
streng aufzubauen, wurde großer Nachdruck auf eine anschauliche Betrachtungs- 
“ weise und auf die Anwendbarkeit der Begriffe und Sätze gelegt. 

In den meisten Fällen werden die Sätze mit vollständigen Beweisen gebracht. 
Nur Beweise, die entweder zu langwierig sind oder mathematische Kenntnisse 
voraussetzen, die weit über die sonst in diesem Buch benötigten hinausgehen, 
wurden weggelassen. 

Der gesamte Text des Buches kann von Studenten gelesen werden, die über 
gewisse Grundlagen der Analysis und Algebra verfügen. Weitreichende Kenntnisse 
in diesen Gebieten oder Kenntnisse aus der Maß- und Integrationstheorie werden 
jedoch nieht benötigt. Einige in diesen Bereich fallende Begriffe (z.B. der des 
Stieltjes-Integrals) werden im Text erläutert. Darüber hinaus ist dem Buch ein 
Anhang beigegeben, in dem gewisse Grundbegriffe und Sätze der modernen 
Maß- und Integrationstheorie behandelt werden. 

An jedes Kapitel schließt sich ein Abschnitt „Aufgaben und Ergänzungen“ 
an. Ein großer Teil dieser Aufgaben ist verhältnismäßig einfach und sollte vom 
Leser gelöst werden. Die übrigen hingegen dienen der Information und Anregung. 

Das Buch eignet sich zur Verwendung bei systematischen Einjahreslehrgängen 
der Wahrscheinlichkeitsrechnung und mathematischen Statistik. Einen Teil des 
hier gebotenen Stoffes habe ich in meinen jährlich wiederkehrenden Vorlesungs- 
zyklen an der Universität Warschau in den Studienjahren 1951/52 bis 1959/60, 
im Frühjahr 1957 an der Universität Peking und in den letzten Jahren in den 
Vereinigten Staaten von Amerika an den Universitäten Washington, Stanford, 
Columbia und New York vorgetragen. 

Das Buch ist auch für Nichtmathematiker geeignet, die sich für Begriffe, Sätze 
und Anwendungsverfahren interessieren. 

Mit der Niederschrift des Manuskripts habe ich 1950 begonnen. Seine erste 
Auflage (374 Seiten) erschien polnisch im Jahre 1954 und war in wenigen Monaten 
vergriffen. Ich habe sodann die zweite, durchgesehene und erweiterte polnische 
Auflage vorbereitet, die im Jahre 1958 gleichzeitig mit ihrer deutschen Über- 
setzung erschien. Im Vergleich zur zweiten Auflage enthält diese dritte Auflage!) 
sehr viele Ergänzungen und Änderungen. Hier die wichtigsten: 

Völlig neu sind die Abschnitte „Aufgaben und Ergänzungen“, der „Anhang“ 
sowie die Paragraphen bzw. Abschnitte 2.7.0, 2.8.C, 3.2.0, 3.6.G, 4.6.B, 6.4.B, 


t) Dieses Vorwort schrieb der Verfasser zu der Auflage, die in englischer Sprache 1963 in 
New York erschien (Anm. d: Red.). 
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6.4.C, 6.12.D, 6.12.F, 6.15, 8.11, 9.4.B, 9.6.E, 9.9.B, 10.10.B, 10.11.E, 12.6.B, 
13.5.E, 13.7.D, 14.2.E, 14.4.D, 15.1.0, 15.3.C, 16.3.D, 16.6 und 17.10.A.. Der 
Abschnitt 8.10 (stationäre Prozesse) wurde ebenfalls fast völlig neu geschrieben. 

Erkeblich verändert oder ergänzt wurden die Abschnitte 2.5.0, 3.5, 3.6.0, 4.1, 
4.2, 5.6.B, 5.7, 5.13.B, 6:2, 6.4.A, 6.5, 6.12.E, 6.12.G, 7.5.B, 8.4.D, 8.8.B, 8.12, 
9.1, 9.7, 10.12, 10.13, 12.4.C, 12.4.D, 13.3, 16.2.0. 

Diese Änderungen und Ergänzungen wurden vorgenommen, um dem oben- 
genannten Hauptanliegen des Werkes besser gerecht zu werden. 

J. Lukaszewıcz, A.M. RusıEokı und W. Sapowskı haben das Manuskript 
der ersten Auflage gelesen und viele Verbesserungen angeregt. Die kritischen 
Bemerkungen von E. MARczEWSKI sowie die von Z. W. BIRNBAUM und S. Zv- 
BRZYCKI verfaßten Rezensionen der ersten Auflage haben mir gute Dienste 
bei der Vorbereitung der zweiten Auflage geleistet. Desgleichen waren die wert- 
vollen Bemerkungen von K. URBANIK sehr nützlich, der das Manuskript zur 
zweiten Auflage gelesen hatte. Zahlreiche Bemerkungen und Berichtigungen 
wurden angeregt von J. WoJTYNIaX und R.ZasgrA (erste Auflage) und von 
L. Kusık, R. SULANKE und J. WroxkA (zweite Auflage). Ihnen allen bin ich in 
tiefstem Dank verbunden. 


New York, Oktober 1962 MAREx Fısz 
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ERSTER TEIL 


WAHRSCHEINLICHKEITSRECHNUNG 


1. ZUFÄLLIGE EREIGNISSE 


11. Einleitende Bemerkungen 


A. Die Wahrscheinlichkeitsrechnung ist ein Teilgebiet der Mathematik, das 
sich damit befaßt, die Gesetzmäßigkeiten unter den zufälligen Ereignissen auf- 
zudecken und zu untersuchen. An Beispielen soll gezeigt werden, was man unter 
einem zufälligen Ereignis versteht. 


Beispiel 1.1.1. Wir werfen ein symmetrisches Geldstück auf den Boden. Es wird ent- 
weder die „Zahl‘“ oder der ‚‚Adler‘‘ oben liegen. Das Ergebnis eines einzelnen Wurfes kann man 
nicht vorhersagen, obwohl jedes Resultat durch einen gewissen Ursachenkomplex bestimmt 
wird. Zu diesen Ursachen gehören die Anfangsgeschwindigkeit des Geldstücks, der Wurfwinkel, 
‚der Glättegrad der Bodenoberfläche, auf die das Geldstück fällt, usw. Da wir aber diese 
Ursachen weder beliebig genau regulieren können noch genau kennen, sind wir auch nicht in 
der Lage, das Ergebnis jedes einzelnen Wurfes im voraus zu berechnen. 

. Das Ergebnis eines Wurfes mit der Geldlmünze — Zahl oder Adler (in der Literatur auch: 
„Kopf oder Wappen‘‘) — bezeichnet man als ein zufälliges Ereignis. 

Beispiel 1.1.2. Nehmen wir an, daß Jahr für Jahr in einem bestimmten Monat und 
an einem bestimmten Ort die mittlere Temperatur beobachtet wird, ‘etwa im Januar in 
Warschau.!) Dieser Mittelwert hängt von vielen Ursachen ab, z. B. von der Richtung und Stärke 
des Windes und vom Feuchtigkeitsgehalt der Luft. Die Auswirkung dieser Ursachen ist von 
Jahr zu Jahr verschieden; deshalb ist die mittlere Temperatur im Januar in Warschau nicht 
Jahr für Jahr die gleiche. Zwar können hier die Ursachen für die verschiedenen mittleren 
Temperaturen festgestellt werden. Häufig ist es aber nicht möglich, die Gründe für das Auf- 
treten dieser Ursachen zu bestimmen, so daß wir im Endergebnis die Temperatur nicht exakt 
voraussagen können. Wir sprechen deshalb von einem zufälligen Ereignis. 


B. Es könnte der Eindruck entstehen, daß sich bei den angegebenen Beispielen 
keinerlei Gesetzmäßigkeit beobachten läßt. Das ist aber doch möglich, wenn die 
Anzahl der Beobachtungen groß genug ist, wenn es sich um eine ‚„Massen- 
erscheinung‘ handelt. 

Kehren wir zum Beispiel 1.1.1 zurück. Man kann zwar nicht das Ergebnis 
eines einzelnen Wurfes voraussagen; wird aber eine lange Serie von Würfen 
ausgeführt, so bemerkt man, daß der Adler annähernd ebenso häufig wie die 
Zahl vorkommt. Mit n sei die Anzahl aller Würfe bezeichnet, mit m die Anzahl 


der Würfe, bei denen der Adler vorkommt. Den Bruch = nennen wir die Häufig- 


n 
keit des Adlers. Die Häufigkeit der Zahl ist gleich dem Bruch 2ZR, Die Er- 


PRABEGEEEIE AALEN n 
1) Siehe Beispiel 12.5.1. 
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fahrung zeigt, daß bei genügend großen Werten von r, das heißt bei vielen Würfen 
mit dem Geldstück (also wieder bei einer Massenerscheinung), die Häufigkeiten 


— und ——— wenig voneinander abweichen und daß jede von ihnen annähernd 
N n 


gleich 1/2 ist. Diese Gesetzmäßigkeit haben viele Forscher bemerkt, die lange 
Wurfserien mit einem Geldstück ausgeführt haben. Burron warf ein Geldstück 
4040mal und erhielt 2048mal das Ergebnis Adler, also betrug die Häufigkeit des 


Adlers ee 0,50693. PEArRsoN, der 24000mal ein Geldstück warf, erhielt als 
n 


Häufigkeit des Adlers 0,5005. Man sieht se daß die beobachtete Häufigkeit 
um die Zahl 0,5 schwankt. 

Im Beispiel 1.1.2 kann man gleichfalls, wie ie langjährige Beobachtungen zeigen, 
eine gewisse Gesetzmäßigkeit feststellen. Mit dieser Frage werden wir uns im 
schon zitierten Beispiel 12.5.1 näher befassen. 


Beispiel 1.1.3. Wir betrachten die Anzahl der Geburten von Jungen und Mädchen in Polen 
während der einzelnen Jahre des Zeitabschnitts von 1927 bis 1932. In keinem Einzelfall kann 
man das Geschlecht eines Neugeborenen voraussagen. Wir fassen das Geschlecht eines Neu- 
geborenen als ein zufälliges Ereignis auf. Wenn man aber eine große Anzahl von Geburten 
beobachtet, wenn also eine Massenerscheinung vorliegt, dann kann man mit großer Genauig- 
keit voraussagen, wieviel Prozent der Neugeborenen Jungen und wieviel-Prozent Mädchen sein 
werden. 

In Tabelle 1.1.1 bezeichnen m bzw. k die Anzahl der Geburten von Jungen bzw. von Mäd- 
chen in den einzelnen Jahren. Die Häufigkeit der Geburten von Jungen bzw. von Mädchen ist 
mit p, bzw. p, bezeichnet, also 


k 


= mtk' 


u -— 
m+k R=- 


Wie man der Tabelle 1.1.1 entnimmt, schwanken die Werte 9, um die Zahl 0,517 und die 
Werte p, um die Zahl 0,483. 


Tabelle 1.1.1. Die Geburten von Jungen und Mädchen 


Geburtenanzahl Geburtenhäufigkeit 
Geburtsjahr Jungen Mädchen Jungen Mädchen 

m k m+k Pı Pa 
1927 496544 462189 958733 0,518 0,482 
1928 513654 477339 990993 0,518 0,482 
1929 514765 479336 994101 0,518 0,482 
1930 528072 494739 1022811 0,516 0,484 
1931 496986 467587 964573 0,515 0,485 
1932 482431 452232. 934663 0,516 0,484 
nn 3032452 | 2833422 5865874 0,517 0,483 


bzw. Mittel 
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Beispiel 1.1.4. Wir werfen einen möglichst genau angefertigten Spielwürfel. Auf den 
Seiten des Würfels sind die Zahlen 1, 2, 3, 4, 5, 6 verzeichnet. Als Ergebnis eines Wurfes 
zeigt sich auf der oberen Seite des Würfels eine der Augenzahlen von 1 bis 6. Das Erscheinen 
irgendeiner bestimmten Zahl ist ein zufälliges Ereignis. Wenn wir eine lange Serie von Würfen 
ausführen und die Würfe zählen, in denen die Eins erscheint, dann bemerken wir, daß die 
Häufigkeit der Eins um 1/6 schwankt. Dasselbe trifft für das Erscheinen jeder anderen Zahl 
auf den Seiten des Würfels zu. 


Diese beobachtete Gesetzmäßigkeit, eben die, daß die Häufigkeit des Ein- 
'treffens eines zufälligen Ereignisses bei einer großen Anzahl von Versuchen 
um einen festen Wert schwankt, liegt dem Wahrscheinlichkeitsbegriff zugrunde. 

Zum Abschluß dieser einleitenden Bemerkungen betonen wir, daß wir die 
Wahrscheinlichkeitsrechnung nur auf solche Ereignisse anwenden, deren Häufig- 
keit wir unter gewissen Bedingungen entweder unmittelbar oder mittelbar 
beobachten oder über deren Eigenschaften wir mit Hilfe von logisch exakten 
Gedankengängen Aufschluß erhalten können. 


1.2. Zufällige Ereignisse und Operationen mit zufälligen Ereignissen 


A. Nun befassen wir uns mit der mathematischen Begriffsbestimmung eines 
zufälligen Ereignisses; die inhaltliche Bedeutung dieses Begriffs ist schon in 1.1 
erläutert worden. 2 

Der Grundbegriff der axiomatischen Theorie der Wahrscheinlichkeitsrechnung, 
zu deren Darstellung wir nun kommen, ist der Begriff der Menge der Elementar- 
ereignisse. Diese Menge bezeichnen wir mit dem Symbol Z. 

Bei jedem einzelnen Problem muß man feststellen, was in diesem Fall unter 
einem Elementarereignis zu verstehen ist, und die Menge E der Elementar- 
ereignisse angeben. 


° Beispiel 1.2.1. Nehmen wir an, daß wir uns beim Würfeln für die Häufigkeit einer geraden 
Augenzahl interessieren. Das Vorkommen einer einzelnen Zahl i, wobei © =1, 2,...,6 ist, 
ist hier ein Elementarereignis, das wir mit e,; bezeichnen. Die Menge der Elementarereignisse 
enthält 6 Elemente. 


In unserem Beispiel untersuchen wir das zufällige Ereignis A, das im Würfeln. 
einer geraden Augenzahl, d.h. einer der Zahlen 2, 4, 6 besteht. Ein solches 
Ereignis schreiben wir in der Form 


(e,, ep ee) . 


Damit meinen wir, daß das zufällige Ereignis (e,, e,,e,) dann eintritt, wenn 
eines der Elementarereignisse e, oder e, oder e, eintritt. 

Wenn wir das Erscheinen einer beliebigen Augenzahl außer der Eins’'beobachten 
wollten, dann hätten wir das fünfelementige Ereignis (e,, e,, &,, &,, €) zu be- 
trachten. 


2% 
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Unter der Menge Z der zufälligen Ereignisse verstehen wir hier die Menge aller 
Teilmengen der Menge E (also der Menge der Elementarereignisse). 
Zur Menge Z gehören zunächst die einelementigen zufälligen Ereignisse 


(&), (eo), (eg), (eg); (8), (ee); 


dabei besteht z.B. das zufällige Ereignis (e,) im Eintreffen des Elementar- 
ereignisses e,, d.h. im Erscheinen der Zahl 4 auf der oberen Seite des Würfels. 
‘Zur Menge Z gehören außer den 6 einelementigen zufälligen Ereignissen 


(&1); - ++» (&6) 


noch die 15 zweielementigen Ereignisse 


(&15 2), ++: > (5, €); 


die 20 Greielemenbigen 
(ei, &9&3)» ...» (Ey Es eo); 


die 15 vierelementigen 


(&1: &2» E33 a)» - + - > (&yr 9» E5; 8) 


und die 6 fünfelementigen Ereignisse 
(e1; 2, 83, 84 &5), .; (ea &3, 04, 85 &) ! 


Aber damit sind wir noch nicht zu Ende; denn die ganze Menge #E ist ebenfalls 
ein Ereignis. Offenbar erhalten wir als Ergebnis eines Wurfes bestimmt eine der 
Zahlen 1, 2, 3, 4, 5, 6, also tritt bestimmt eines der Elementarereignisse der 
Menge E, mithin das Ereignis 


(&1, 82; Ey, 4; &5, &) 


ein. Im täglichen Leben betrachtet man ein Ereignis, dessen Eintreffen sicher 
ist, nicht als zufälliges Ereignis. Wir aber werden ein mit Sicherheit eintreten- 
des Ereignis auch als zufälliges Ereignis ansehen und es zur Menge Z der zufälligen 
Ereignisse hinzuzählen. 

Beim Würfeln betrachten wir endlich noch das Ereignis, daß eine größere 
Zahl als 6 vorkommt. Dieses Ereignis kommt unter den Elementen der Menge 
E nicht vor, ist also als Teilmenge der Menge E die leere Menge. Ein solches 
Ereignis ist natürlich. unmöglich, und gewöhnlich betrachtet man es nicht als 
zufällig. Wir aber werden auch ein unmögliches Ereignis als zufälliges Ereignis 
ansehen, es als Teilmenge der Menge E zur Menge Z der zufälligen Ereignisse 
hinzuzählen und es mit dem Symbol (0) bezeichnen. 

Zusammen mit dem unmöglichen und dem sicheren Ereignis enthält die Menge 
Z der zufälligen Ereignisse in unserem Beispiel 64 Ereignisse. 
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Hat allgemein die Menge der Elementarereignisse » Elemente, so enthält die 
Menge Z der zufälligen Ereignisse 2” Ereignisse, nämlich: 


1 unmögliches Ereignis (die leere Menge), 
n ; : hu 2 - 
einelementige Ereignisse, 
1), 
n j ee 
5 zweielementige Ereignisse, 
n RER ECHTEN 
(rn — 1)-elementige Ereignisse, 
n—i 
1 sicheres Ereignis (die ganze Menge E). 


B. Damit beenden wir die Betrachtungen, die sich auf das Beispiel 1.2.1 stützten. 
In diesem Beispiel war die Menge der Elementarereignisse endlich. In der Wahr- 
scheinlichkeitsrechnung untersucht man abcr auch Probleme, für die die Menge 
der Elementarereignisse abzählbar oder von der Mächtigkeit des Kontinuums 
ist. Im letzten Fall enthält die Menge Z der zufälligen Ereignisse nicht alle 
Ereignisse, d. h., sie enthält nicht alle Teilmengen der Menge E. Wir beschränken 
uns auf ein System von Teilmengen von Z, die einen Borelschen!) Körper Z 
bilden. Der Leser findet die Definition eines solchen Mengensystems am Ende 
dieses Paragraphen, da das Buch auch einem Leser zugänglich sein soll, der die 
Mengenoperationen nicht kennt, während die Definition eines Borelschen Körpers 
die Kenntnisse solcher Operationen verlangt. Im Laufe der weiteren Darlegung 
wird auch erklärt, warum im allgemeinen Fall die Menge Z der zufälligen: Er- 
eignisse nicht als Menge aller Teilmengen von E definiert wird. 

Wir kommen jetzt zur Definition eines zufälligen Ereignisses. In dieser Defini- 
tion tritt der Begriff des Borelschen Körpers Z auf. Da dieser Begriff nicht 
vollständig präzisiert wurde, müssen wir in diesem Paragraphen auf die Definition 
des zufälligen Ereignisses zurückkommen (vgl. Definition 1.2.10). 


Definition 1.2.1. Wir nennen jedes Element des Borelschen Körpers Z ein 
zufälliges Ereignis. 

Der Körper Z ist also die Menge aller zufälligen Ereignisse. 

Definition 1.2.2. Das Ereignis, das alle Elemente der Menge E enthält, 
nennen wir das sichere Ereignis. 


Definition 1.2.3. Das Ereignis, das kein Element der Elementarereignismenge 
E enthält, nennen wir das unmögliche Ereignis. 


1) Nach dem französischen Mathematiker BoREL. 
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Das unmögliche Ereignis bezeichnen wir, wie schon gesagt, mit dem Symbol (0). 


Definition 1.2.4. Wir sagen, daß das Ereignis A in dem Ereignis. B enthalten 
ist, wenn jedes Elementarereignis, das zur Menge A gehört, auch in der Menge B 
vorhanden ist. j 

Wir schreiben 


AcB 


und lesen: A ist in B enthalten. 

Diesen Sachverhalt soll Abb. 1.2.1 erläutern. Hier bedeuten das Quadrat E die 
Menge der Elementarereignisse und die Kreise A und B Teilmengen von E. 
Die Menge A ist in der Menge B enthalten. 


Definition 1.2.4’. Wir sagen, daß die Ereignisse A und B gleich sind, wenn A 
in B und Bin 4 enthalten ist. 
Wir schreiben 


A=B. 


Wir setzen folgende Eigenschaften der Menge Z voraus: 


Eigenschaft 1.2.1. Die Menge Z der zufälligen Ereignisse enthält als Element 
die Menge E der Elementarereignisse. 


Eigenschaft 1.2.2. Die Menge Z der zufälligen Ereignisse enthält als Element 
die. leere Menge (0). 

Diese beiden Eigenschaften besagen, daß die Menge Z der zufälligen Ereignisse 
als Elemente das sichere und das unmögliche Ereignis enthält. 


Definition 1.2.5. Wir sagen, die Ereignisse A und B schließen einander aus, 
wenn sie kein Elementarereignis gemeinsam haben. 


Beispiel 1.2.2. Das zufällige Ereignis A bestehe darin, daß in einer Gruppe von n im Jahre 
1950 geborenen Personen zwei das Jahr 2000 erleben, das zufällige Ereignis B darin, daß zwei 
oder mehr Personen der gleichen Gruppe bis zum Jahr 2000 leben. Die Ereignisse A und 
B schließen einander nicht aus. 

Wenn wir dagegen. das Ereignis B* betrachten, welches darin besteht, daß nur eine einzige 
Person das Jahr 2000 erlebt, dann schließen die Ereignisse A und B* einander aus, 

Wir wollen dieses Beispiel näher untersuchen. Es kann geschehen, daß in der betrachteten 
Gruppe von n Personen nur eine Person das Jahr 2000 erlebt oder aber zwei, drei oder sogar n; 
es ist auch möglich, daß keine Person dieses Jahr erlebt. Die Menge E besteht hier aus n +1 
Elementarereignissen &,, €; .--, 7, wobei die Indizes 0,1,...,% die Anzahl der Personen bezeich- 
nen, die bis zum Jahr 2000 leben. In diesem Beispiel enthält das zufällige Ereignis 4 ein einziges 
Element, und zwar das Element e,. Das zufällige Ereignis B enthält n — 1 Elemente, nämlich 
die Elementarereignisse e,, e3, ..., &,. Das gemeinsame Element der zufälligen Ereignisse A 
und B ist das Elementarereignis e,, also schließen sich die beiden zufälligen Ereignisse nicht aus. 
Dagegen enthält das zufällige Ereignis B* nur ein Element, nämlich das Element e,. Die zu- 
fälligen Ereignisse A und B* enthalten kein gemeinsames Element, schließen einander also aus. 


€. Wir gehen nun zur Besprechung der Operationen über, die man für Ereignisse 
erklären kann. A,, A,, ... sei eine endliche oder abzählbare Folge von Ereignissen. 
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Definition 1.2.6. Das Ereignis A, das alle Elementarereignisse und nur diese 
enthält, die zu irgendeinem der Ereignisse A,, Az ... gehören, nennen wir die 
Summe der Ereignisse A,, As ---- 

Wir schreiben 


A=4AUAVU.. oder A=A,+4+- oder A=NA4; 
i 
und lesen: A gleich A, oder Ay oder .... 


Abb. 1.2.1 Abb. 1.2.2 


Wir wollen die Summe von Ereignissen an einer Zeichnung (Abb. 1.2.2) er- 

läutern. Hier bedeutet das Quadrat E die Menge der Elementarereignisse, während 
die Kreise A,, Az, A, drei Ereignisse darstellen; das schraffierte Gebiet stellt die 
Summe A, + A; + A, dar. 
. Die hier gegebene Definition der’ Summe der Ereignisse entspricht der mengen- 
theoretischen Vereinigung der Teilmengen A,,A,... in der Menge E_ der 
Elementarereignisse. Die Summe der Ereignisse tritt: genau dann ein, wenn 
wenigstens eines dieser Ereignisse eintritt. 

Hier erhebt sich die wichtige Frage, ob die Summe beliebiger endlich oder 
abzählbar vieler zufälliger Ereignisse zur Menge Z gehört, d.h., ob sie wieder 
ein zufälliges Ereignis ist. 

Soll die Frage bejaht werden, so muß die Menge Z der zufälligen Ereignisse 
die folgende Eigenschaft besitzen: 


Eigenschaft 1.2.3. Gehören die endlich oder abzählbar vielen Ereignisse 
A, 4a, ... zur Menge Z, so gehört ihre Summe ebenfalls zu Z. 


Man bestätigt leicht, daß für ein beliebiges Ereignis A folgende Gleichungen 
gelten: 


AUA=A, AUE=E, AUO)=A. 


Wir wollen als Beispiel für Beweise dieser Art die Beziehung AU A = 4 be- 
weisen. Das Elementarereignis e gehöre zu A. Dann gehört es auch zu AU 4, 
woraus die Relation A = (A \J A) folgt. Gehört andererseits e zu AUA, so 
auch zu A, woraus (A U A) A folgt. Nach Definition 1.2.4’ gilt also A = AU A. 
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Definition 1.2.7. Das Ereignis A, welches die Elementarereignisse und nur 
diese enthält, die zum Ereignis A,, aber nicht zum Hreionis A, gehören, nennen 
wir die Dnfieren? der Ereignisse A, und 4,. 

Wir schreiben 


ae ee 


Die Differenz von Ereignissen wird an Abb. 1.2.3 erläutert. Hier bedeutet 
das Quadrat # die Menge der Elementarereignisse, die Kreise A, und A, sind 
zwei Ereignisse. Das schraffierte Gebiet stellt die Differenz A, — A, dar. 


Abb. 1.2.3 


Die Differenz A — A, der Ereignisse tritt genau dann ein, wenn das Ereignis 
A,, nicht aber das "Ereignis A, eintritt. 

Schließen die Ereignisse A, und A, einander aus, so stimmt die Differenz 
A, — 4, mit dem Ereignis A, Abasa. 

Wie oben fordern wir die folgende Eigenschaft der Menge Z der. zufälligen 
Ereignisse: 


Eigenschaft 1.2.4. Gehören die Ereignisse A, und A, zur Menge Z, so gehört 
auch ihre Differenz zu Z. 


Beispiel 1.2.3. Wir betrachten eine bestimmte Gruppe von Familien. Die Anzahl der 
Kinder einer dieser Familien ist ein zufälliges Ereignis. Das Ereignis A bestehe darin, daß 
eine zufällig?) gewählte Familie genau ein Kind hat, das Ereignis B darin, daß diese 
Familie wenigstens ein Kind hat. Die Summe A + B der Ereignisse A und B besteht dann 
darin, daß die zufällig gewählte Familie wenigstens ein Kind hat. 

Die höchste Kinderzahl in einer Familie der Gruppe sei n. Die Menge der Elementar- 
ereignisse besteht dann aus a + 1 Elementen, welche wir wie in Beispiel 1.2.2 mit den Sym- 
bolen &9, €, &3; ---, €, bezeichnen wollen. Da das Ereignis A nur das Elementarereignis e, und 
das Ereignis B die Elementarereignisse e,, ..., &, enthält, besteht ihre Summe aus den Ele- 
mentarereignissen e,, 9, ..., &,. Die Differenz 4 — B der Ereignisse ist hier selbstverständlich. 
ein unmögliches Ereignis, da es kein Elementarereignis gibt, das zu A, nicht aber zu B gehört. 
Die Differenz B — A dagegen enthält die Elemente e,, e,, ..., e, und ist das Ereignis, daß 
die willkürlich gewählte Familie mehr als ein Kind besitzt. 


Definition 1.2.8. Das Ereignis A, das alle Elementarereignisse und nur 
diese enthält, die in allen Ereignissen A,, A,, ... enthalten sind, nennen wir das 
Produkt dieser Ereignisse. 


1) Wie man eine zufällige Auswahl trifft, wird später erklärt. 
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Wir schreiben 
A=4A,N4A;N... oder A=4,Ay- oder A=/]A 


und lesen: A gleich A, und A, und .... 

Das Produkt von Ereignissen wollen wir an Abb. 1.2.4 erläutern. Hier be- 
deutet das Quadrat E die Menge der Elementarereignisse, und die Kreise A,, A,, Az 
sind drei Ereisnisse; das schraffierte Gebiet stellt das Produkt A,4,4, dar. 


Abb. 1.2.4 


Die hier gegebene Definition des Produkts von Ereignissen entspricht dem 
Durchschnitt der Teilmengen A,, As, ... in der Menge E der Elementarereignisse. 
Das Produkt A von -Ereignissen 4; tritt genau dann ein, wenn alle Ereignisse A, 
eintreten. Pe 

Wir fordern die folgende Eigenschaft der Menge Z: 


Eigenschaft 1.2.5. Gehören die endlich oder abzählbar vielen Freignisse 
A, Ag, ... zur Menge Z, so gehört ihr Produkt ebenfalls zu Z. 
Man bestätigt leicht für ein beliebiges Ereignis A die Gleichungen 


ANA=A, ANE=A, AN(0)=(0). 


Beispiel 1.2.4. Das Ereignis A bestehe darin, daß eine zufällig gewählte Bauernwirtschaft 
wenigstens ein Pferd und nicht weniger als einen Pflug hat, wobei die höchstmögliche Anzahl 
der Pferde sowie der Pflüge gleich Zwei sein soll. Das Ereignis B bestehe darin, daß in der Wirt- 
schaft genau ein Pferd und nicht mehr als ein Pflug vorhanden ist. Wir suchen das Produkt 
der Ereignisse A und B. 

Die Menge der Elementarereignisse besteht hier aus 9 Elementen, die wir mit den Symbolen 


oo» E91 80a» E10 Ein E12» 20 E21> E22 


bezeichnen, wobei der erste Index die Anzahl der Pferde und der zweite die Anzahl der 
Pflüge angibt, die in der Wirtschaft vorhanden sind. 

Das Ereignis A enthält vier Elementarereignisse e,,, &ı2 @g1> €, das Ereignis B zwei, 
nämlich e,, und e,... Das Produkt A N) B enthält ein Elementärereignis e,, und bedeutet, 
daß in der Wirtschaft genau ein Pferd und genau ein Pflug vorhanden sind. 


Definitiomt.2.9. Wir nennen die Differenz E — A das zu A komplementäre 
Ereignis und bezeichnen es mit 4. 
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Abb. 1.2.5 veranschaulicht das zu A komplementäre Ereignis. Hier bedeuten 
E die Menge der Elementarereignisse und der Kreis A ein Ereignis, während das 
schraffierte "Gebiet das zu A komplementäre Ereignis A darstellt. 

Die obige Definition kann man auch so formulieren: 

Das Ereignis A, daß das Ereignis 4 nicht eintritt, nennen wir das zu A kom- 
plementäre Ereignis. 

Nach den Eigenschaften 1.2.1 und 1.2.4 der Menge Z der zufälligen Ereignisse 
ist das Ereignis A ebenfalls ein zufälliges Ereignis. 


Abb. 1.2.5 


Beispiel 1.2.5. Wir haben einen Satz Glühlampen und interessieren uns für deren Brenn- 
dauer ti. Dazu setzen wir einen Wert i, fest und bezeichnen eine Glühlampe, die in einer 
kürzeren Zeit als , durchbrennt, als fehlerhaft. Nun greifen wir eine Glühlampe willkürlich 
heraus. Das Ereignis A bestehe im Herausgreifen einer fehlerhaften Glühlampe. Dann ist das 
Herausgreifen einer fehlerlosen Glühlampe, die wenigstens während t, Zeiteinheiten brennt, 
das zu A komplementäre Ereignis A. 


Wir bringen jetzt die schon angekündigte Definition (vgl. Anhang) eines 
Borelschen Mengenkörpers von zufälligen Ereignissen. 


Definition 1.2.10. Eine Menge Z von Teilmengen einer bestimmten Menge 
E von Elementarereignissen mit den Eigenschaften 1.2.1 bis 1.2.5 nennen wir 
einen Borelschen Mengenkörper und dessen Elemente zufällige Ereignisse. 


In Zukunft wollen wir uns ausschließlich mit zufälligen Ereignissen befassen 
und werden deshalb statt ‚‚zufälliges Ereignis‘ oft nur kurz ‚Ereignis‘ sagen. 

Die folgenden Bezeichnungen sollen dazu dienen, die Formulierungen und 
Beweise einiger Sätze im Laufe der weiteren Darstellung zu vereinfachen. 


Definition 1.2.11. Wir nennen eine Folge {A,} (nr = 1,2, ...) von Ereignissen 
absteigend, wenn für jedes n die Beziehung 


Aysı c A, 


gilt. Das Produkt A einer absteigenden Folge {A,„} nennen wir den Limes dieser 
. Folge und schreiben 


A=]I4, = lim A,. 


n21 R>0O 


1.3. Das Axiomensystem der Wahrscheinlichkeitsrechnung 27 


Definition 1.2.12. Wir nennen eine Folge {A,} (n =1,2,...) von 
Ereignissen aufsteigend, wenn für jedes n die Beziehung 
l 


Anıı D An 


gilt. Die Summe A einer aufsteigenden Folge {A,} nennen wir den Limes dieser 
Folge und schreiben 


A= )}% A, = lim A,. 


n21l N 


1.3. Das Axiomensystem der Wahrscheinlichkeitsrechnung 


A. In der Umgangssprache benutzt man den Wahrscheinlichkeitsbegriff ohne 
genaue Bestimmung seiner Bedeutung. Die Wahrscheinlichkeitsrechnung als 
ein Teil der mathematischen Wissenschaft aber muß diesen Begriff genau fest- 
legen. Das soll durch ein System von .Axiomen geschehen, die einige grund- 
legende Eigenschaften dieses Begriffes angeben, d. bh. durch eine Axiomatisierung 
der Wahrscheinlichkeitsrechnung.!) Die weiteren Eigenschaften der Wahrschein- 
lichkeiten erhalten wir als Sätze, die aus diesen Axiomen hergeleitet werden. 

Der exakte Begriff des zufälligen Ereignisses, dessen Bedeutung im vorher- 
gehenden Paragraphen erklärt wurde, ist die mathematische Formulierung 
dessen, was man in der Umgangssprache gewöhnlich unter einem zufälligen 
Ereignis versteht. Das Axiomensystem, das wir jetzt formulieren wollen und 
das den Begriff der Wahrscheinlichkeit eines zufälligen Ereignisses präzisiert, 
ist die mathematische Fassung der Gesetzmäßigkeiten, die für die Häufigkeiten 
der zufälligen Ereignisse beobachtet werden konnten. Diese Gesetzmäßigkeiten 
treten im Ergebnis von langen Versuchsreihen auf, die unter denselben Be- 
dingungen ausgeführt werden. 

Wie schon bemerkt wurde (vgl. 1.1), hat man beobachtet, daß die Häufigkeit 
des Eintretens eines zufälligen Ereignisses um einen festen Wert schwankt, 
wenn die Versuchsserie genügend lang ist. Diese für die Häufigkeit von zufälligen 
Ereignissen. beobachtete Gesetzmäßigkeit und die Tatsache, daß die Häufigkeit 
ein nichtnegativer Bruch ist, der höchstens gleich Eins ist, legt die Annahme des 
folgenden Axioms nahe. Dabei sei eine bestimmte Menge E von Elementar- 
ereignissen und ein Borelscher Körper Z von Teilmengen von E gegeben. 


!) Der axiomatischen Fassung der Wahrscheinlichkeitsrechnung sind viele Arbeiten ge- 
widmet. Wir nennen hier die Arbeiten von BERNSTEIN [1], Lomntoxt [1], Renyı [4], Steim- 
Haus [1] und das Buch von MAzurkıswicz [1]. Das axiomatische System, das wir in diesem 
Paragraphen angeben, stammt von KoLmocororr [7]. (Die Zahlen in den Klammern be- 
‚ziehen sich auf die Nummer der zitierten Arbeit im Literaturverzeichnis, das sich am Ende 
des Buches befindet.) Die Grundbegriffe der Wahrscheinlichkeitsrechnung sind auch in dem 
bekannten Werk von LarLacz [1] sowie in den Arbeiten von HAUSDORFF [1], vox Mıses [1], 
[2], JerFreys [1] und Barankıs [2] untersucht worden. 
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AxiomI. Jedem zufälligen Ereignis A entspricht eine bestimmte Zahl P(A), 
seine Wahrscheinlichkeit, welche die Ungleichung 


0<P(4)<i 


erfüllt. 


Das folgende einfache Beispiel führt intuitiv zur Formulierung eines weiteren 
Axioms. 


Beispiel 1.3.1. In einer Urne befinden sich nur schwarze Kugeln. Das Experiment bestehe 
im Herausgreifen einer Kugel aus der Urne. Es bezeichne m/n wie bisher die Häufigkeit einer 
schwarzen Kugel. Dann ist klar, daß hier immer m/n = 1 ist. Die Auswahl einer schwarzen 
Kugel ist in diesem Fall ein sicheres Ereignis, und seine Häufigkeit ist, wie wir sehen, gleich 
Eins. 


Bei der Formulierung des folgenden Axioms berücksichtigen wir diese Eigen- 
schaft des sicheren Ereignisses. 


AxiomII. Die Wahrscheinlichkeit des ‚sicheren Ereignisses ist gleich Eins. 


Diese Eigenschaft läßt sich durch die Formel 
P(E)=1 


ausdrücken. 


Wir werden in 2.3 sehen, daß die Umkehrung des Axioms II nicht gilt: Wenn 
die Wahrscheinlichkeit eines zufälligen Ereignisses A gleich Eins ist, also P(A) =1, 
dann braucht die Menge A nicht alle Elementarereignisse der Menge E zu enthalten. 

Wir haben schon gesehen, daß die Häufigkeit einer Sechs beim Würfeln um die 
Zahl 1/6 schwankt. Dasselbe gilt für die Häufigkeit der Zwei. Offenbar schließen 
diese beiden Ereignisse einander aus, und man beobachtet, daß die Häufigkeit 
einer Zwei oder Sechs, d.h. die Häufigkeit der Summe dieser Ereignisse, gleich 
der Summe der Häufigkeiten ist und um die Zahl 1/6 + 1/6, d. h. um 1/3 schwankt. 

Der Versuch lehrt, daß in einem Kartenspiel mit 52 Karten (4 Farben zu je 
13 Karten) die Häufigkeit irgendeines der 4 Asse, wenn man sehr oft eine Rarte 
zieht, ungefähr 4/52 beträgt, die Häufigkeit der 13 Pique-Karten ungefähr 
13/52; dagegen schwankt die Häufigkeit der Summe ,‚As oder Pique‘ nicht 
um die Zahl 4/52 + 13/52 = 17/52, sondern um die Zahl 16/52. Das erklärt sich 
daraus, daß die zufälligen Ereignisse „As‘‘ oder „Pique‘‘ einander nicht aus- 
schließen (man kann das Pique-As ziehen); die Häufigkeit der Summe ‚As oder 
Pique‘‘ ist also nicht gleich der Summe der Häufigkeiten der Ereignisse ‚As‘ 
und „Pique‘“. Bei der Formulierung des folgenden letzten Axioms berücksichtigen 
wir diese Eigenschaft der Häufigkeit von Summen. 


Axiom III. Die Wahrscheinlichkeit einer Summe von endlich oder abzählbar 
vielen zufälligen Ereignissen, die einander paarweise ausschließen, ist gleich der 
Summe der Wahrscheinlichkeiten dieser Ereignisse. 
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Unter Anwendung dieses Axioms kann man die Wahrscheinlichkeit eines 
zufälligen Ereignisses, das aus endlich oder abzählbar vielen Elementarereignissen 
€; besteht, wobei (,)EZ (k=1,2, :..), durch die Summe von Wahrscheinlich- 
keiten von einelementigen Ereignissen ausdrücken: 


P(e&y..) = Ple) + Ple) +. 


Wenn wir allgemein eine endliche oder abzählbare Folge von zufälligen Er- 
eignissen {A,} (k=1,2,...) haben, wobei diese Ereignisse einander paarweise 
ausschließen, dann gilt nach Axiom III die Formel 


P(2A,) = I P(A,). (1.3.1) 
k E 
Die durch das Axiom III angegebene Eigenschaft nennen wir die vollständige 


Additivität der Wahrscheinlichkeit.!) 

Axiom III bezieht sich nur auf Summen von Ereignissen, die einander paarweise 
ausschließen. Jetzt seien A und B beliebige zufällige Ereignisse, die einander 
nicht notwendig ausschließen. Wir wollen die Wahrscheinlichkeit der Summe 
dieser Ereignisse bestimmen. 

Es gilt 

AUB=AU(B-—- AB), 
B=ABU(B-—-AB). 

Die rechten Seiten dieser Gleichungen sind Summen von Ereignissen, die 

‚einander ausschließen, also erhält man nach Axiom III die Beziehungen 


P(AUB)=P(A)+P(B— AB), 
P(B) = P(AB) + P(B— AB). 


Aus beiden Gleichungen erhalten wir für die Wahrscheinlichkeit der Summe 
der Ereignisse A und B die Formel 


P(AUB)=P(4)+P(B)— P(AB). | . (1.3.2) 


Es seien A, A, ..., A, (rn 3) beliebige zufällige Ereignisse. Dann läßt sich 
leicht die folgende (von PoINcAR& stammende) Formel herleiten: 


R R n 
P 2 an = EP(A)— N P(4,4,) 
k=1 k=1 De: 


+ 23 P(4,4,4,) ++ (Dr PlA, An). (1.3.2) 
kukzakı=ı 
kı<ka<k; 


1) Man sagt auch, die Wahrscheinlichkeit P(4A), die die angegebenen Axiome I bis III 
erfüllt, ist ein normiertes, nichtnegatives, vollständig additives Maß auf dem Borelschen 
Mengenkörper Z von Teilmengen der Menge E. 
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r 


B. Wir betrachten endlich oder abzählbar viele zufällige Ereignisse A, (k=1,2,...). 

Wenn jedes Elementarereignis der Menge E wenigstens zu einem der zufälligen 

Ereignisse A,, A,, ... gehört, dann sagen wir, daß diese zufälligen Ereignisse die 

Menge E ausschöpfen oder überdecken. Die Summe }/ A, enthält alle Elementar- 
k 

ereignisse von Z, sie ist also das sichere Ereignis. Gemäß Axiom II erhalten wir: 


Satz 1.3.1. Wenn endlich oder abzählbar viele zufällige Ereignisse Ay A -.- 
die Menge der Elementarereignisse. E ausschöpfen, dann gilt 
P(2 Ar) =1: (1.3.3) 
k ve 


Beispiel 1.3.2. Die Menge aller nichtnegativen ganzen Zahlen sei die Menge E der Ele- 
mentarereignisse. Das Ereignis, das im Auftreten der Zahl n besteht (n = 0,1, 2, ...), be- 
zeichnen wir mit (e,). Nun nehmen wir an, daß 


[4 
Pie) = Ar 


ist; dabei ist c ein Proportionalitätsfaktor. Aus Satz 1.3.1 und Axiom III folgt 
x x 1 
e( P2 «) = —. 
n=0 n=o R! 
Nun ist aber 
Piöe«,l=-1 und SW —=e, 
n=0 on=0 n! 


wobei e die Basis der natürlichen Logarithmen ist. Wir erhalten also 1 = ce und folglich 
ce. 

Wie es sich in den weiteren Kapiteln zeigen wird, haben wir es in diesem Beispiel mit einem 
Spezialfall der Poissonverteilung zu tun, die häufig in Anwendungen vorkommt. 


Wir beweisen den folgenden Satz: 


Satz 1.3.2. Die Summe der Wahrscheinlichkeiten des zufälligen Ereignisses A 
und des zu A komplementären Ereignisses A ist gleich Eins. 


Beweis. Aus der Definition des Ereignisses A folgt, daß die Summe AU A 
der Ereignisse A und A ein sicheres Ereignis ist. Wir erhalten also nach Axiom II 


PAUA)=1. 

Die Ereignisse A und A schließen aber einander aus; also ist nach Axiom III 
P(AUA)=P(4)-+P(4) 

und schließlich 
P(A) +P(4)=1. (1.3.4) 
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4A sei ein unmögliches Ereignis. Wir beweisen folgenden 
Satz 1.3.3. Die Wahrscheinlichkeit des unmöglichen Ereignisses ist gleich Null. 
Beweis. Für jedes zufällige Ereignis A gilt die Gleichung 

AUE=E. 


Wenn A das unmögliche Ereignis ist (also kein Elementarereignis enthält), 
dann schließen A und E einander aus, da sie kein gemeinsames Element besitzen. 
Durch Anwendung von Axiom III erhalten wir 


P(4)+P(E)=P(E). 
Daraus folgt 
P(A)=0. 


Wir werden in 2.3 sehen, daß die Umkehrung dieses Satzes falsch ist; wenn die 
Wahrscheinlichkeit eines Ereignisses gleich Null ist, folgt daraus noch nicht, daß es 
das unmögliche Ereignis ist. 


€. Die beiden folgenden Sätze finden vielfach Anwendung: 


Satz 1.3.4. Es sei {A,} (n=1,2,...) eine absieigende Folge von Ereignissen 
und A das Produkt der Ereignisse A,„. Dann gilt die Beziehung 


P(4) = lim P(A,). (13,5) 
n>X 
Beweis. Da die Folge (A,} absteigend ist, gilt für jedes » die Gleichung 


An = N Ardyı +4. 


k=n 


Aus der Formel (1.3.2) folgt weiter 


oo 


P(A,)=P (£ Ada) + P(4) — e(4 2 Ana). 1.3.6) 


Nun ist 
AN Ar Ar = AA An; 
ken k=n 
das Ereignis 
AA; Ay 


ist jedoch für jedes % ein unmögliches Ereignis, also ist 


P(AA Ar) = 0. 
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Nach Axiom III erhalten wir dann 
e(2 Add) >= 0. 
k=r 


Da sich die Ereignisse in der Summe auf der rechten Seite der Formel (1.3.6) 
‚paarweise ausschließen, haben wir 


P(A,) = N P(AyAyu):+ P(A). (1.3.7) 
k=n 
Andererseits ist die Reihe 
PA, Ay) 
k=1 


konvergent; denn sie ist eine Summe von nichtnegativen Summanden, die 
höchstens gleich Eins ist. Daraus folgt, daß für n —oo die Summe in Formel 
(1.3.7) gegen Null strebt. Also erhält man 


lim P(A,) = P(A). 


N 


Satz 1.3.5. Es sei {A,} (n =1,2,...) eine aufsteigende Folge von Ereignissen : 


und A die Summe der Ereignisse A„. Dann gilt die Beziehung 


P(4) = lim P(A,). | (1.3.8) 


n>09 


Beweis. Wir betrachten die Folge {A „} der zu A, komplementären Ereignisse. 
Da {A,„} eine aufsteigende Folge ist, muß die Folge {A} absteigend sein. Es sei 
A das Produkt der Ereignisse A,. Aus Satz 1.3.4 folgt 


P(A) = lim P(A,) 
und daraus 
P(A)=1—-P(A)=1-IimP(4,)=1-—lim[t — P(4,)] 
2X 


Nn>0O 


= lim P(A,). 


Nn->00 


Damit ist der Satz bewiesen. 
Wir wollen noch einen einfachen Satz angeben: 


Satz 1.3.6. Gilt für die zufälligen Ereignisse A und B die Beziehung 
AcB, 
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dann ist. 
P(4)< P(B). 


Beweis. Wir schreiben 
B=4A+(B-—-A). 
Die Ereignisse A und B — A schließen einander aus, also ist nach Axiom III 
P(B)=P(AJ+P(B-4A). 
Da P(B — 4) > 0 ist, erhalten wir P(B) > P(4). 


1.4. Anwendungen der Kombinatorik zur Berechnung 
von Wahrseheinlichkeiten 


Bei einigen Problemen kann man die Wahrscheinlichkeiten mit Hilfe von Formeln 
aus der Kombinatorik berechnen.!) Wir wollen das an Beispielen zeigen. 


Beispiel 1.4.1. In einer Urne befinden sich 5 verschiedenfarbige Kugeln. Wir nehmen 
an, daß die Wahrscheinlichkeit, gezogen zu werden, für jede Kugel dieselbe, und zwar gleich 
p ist. 

Die Menge E besteht hier aus 5 Elementarereignissen, und nach unserer Annahme hat 
jedes von ihnen die gleiche Wahrscheinlichkeit. Auf Grund. von Satz 1.3.1 erhalten wir 
5p = 1, also p = 1/5. 

Beispiel 1.4.2. In einer Urne befinden sich 9 Papierstreifen gleicher Größe. Die Streifen 
seien so mit den Zahlen 1 bis 9 versehen, daß nicht zwei Streifen gleich bezeichnet sind. 

Die Menge E besteht hier aus 9 Elementarereignissen. Das zufällige Ereignis, das im 
Ziehen eines Streifens mit einer geraden Zahl besteht, bezeichnen wir mit A. Wie groß ist 
seine Wahrscheinlichkeit? 

Ähnlich wie vorher setzen wir voraus, daß die Wahrscheinlichkeit, gezogen zu werden, 
für jeden einzelnen Streifen dieselbe, also gleich 1/9 ist. Einen Streifen mit einer geraden 
Zahl erhalten wir dann, wenn wir einen Streifen ziehen, der mit einer der Zahlen 2, 4, 6, 8 
versehen ist. Nach Axiom III ist die gesuchte Wahrscheinlichkeit 

1 1 1 1 4 


PiA=-—-+ | es 
a e'’9'9'9°9 


Wollen wir für dieses Beispiel die Wahrscheinlichkeit eines mit einer ungeraden Ziffer 
versehenen Streifens berechnen, so müssen wir nur beachten, daß dieses zufällige Ereignis 
zum Ereignis A komplementär ist, und wir erhalten, wenn wir es mit A bezeichnen, durch 
‚Anwendung von Satz 1.3.2 

5 


P(d4)=1-—-P(4)= g 


1) Diese Formeln findet man z. B. im Buch von Mosrowskt und STARK [1], S. 12, sowie in 
FLACHSMEYER [1]. 


3 Fisz 
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Beispiel 1.4.3. Wir werfen eine Münze dreimal. Wie groß ist die Wahrscheinlichkeit 
dafür, daß der Adler zweimal vorkommt? Für die Ergebnisse von drei Würfen gibt es 2° = 8 
verschiedene Fälle. Bezeichnen wir das Vorkommen des Adlers mit A und das der Zahl mit 
K, so sind folgende Anordnungen möglich: 


AAA,AAK,AKA,KAA,AKK,KAK,KKA,KKK: 


Diese Anordnungen bilden die Menge E. Jede dieser Anordnungen sehen wir als Elementar- 
ereignis an und setzen voraus, daß sie mit gleicher Wahrscheinlichkeit auftreten. Dann ist die 
Wahrscheinlichkeit einer beliebigen Anordnung gleich 1/2. Aus der obigen Zusammen- 
stellung sehen wir, daß das Ereignis „zweimal Adler‘‘ in drei Elementarereignissen vor- 
kommt (AAK,AKA,K AA). Also ist auf Grund von Axiom III die gesuchte Wahrscheinlich- 
keit gleich 3/8. 


Wenn wir in unserem Beispiel n Würfe an Stelle von drei betrachten und 
die Wahrscheinlichkeit suchen, m-mal den Adler zu erhalten, so müssen wir 
folgendermaßen schließen: 

Bei n Würfen gibt es 2” Möglichkeiten für die Anordnung der Ergebnisse. 
Anordnungen, in denen der Adler m-mal vorkommt, gibt es so viele, wie es 
Kombinationen zu je m Elementen aus n Elementen gibt: 


n\ n! 
(r) m!ln — m)! 


Ist jede Anordnung, die man im Ergebnis von n Würfen erhält, gleich wahr- 
scheinlich, dann beträgt die gesuchte Wahrscheinlichkeit 
n! 
———, (1.4.1) 
2rmi(n — m)! 
Beispiel 1.4.4. Wir wollen die Wahrscheinlichkeit dafür berechnen, daß bei drei Würfen 
der Adler wenigstens zweimal vorkommt. 
Das betrachtete zufällige Ereignis tritt dann ein, wenn bei drei Würfen der Adler zweimal 


oder dreimal vorkommt. Nach Formel (1.4.1) beträgt die Wahrscheinlichkeit dafür, daß der 
Adler dreimal vorkommt, 


3! 
23310! 


41 
=, 


während die Wahrscheinlichkeit, daß der Adler zweimal vorkommt, wie wir schon wissen, 
3/8 ist. Auf Grund von Axiom III ist also die gesuchte Wahrscheinlichkeit 


ER. 
8.7802, 


In den Beispielen 1.4.1 bis '1.4.4 wurde vorausgesetzt, daß alle Elementar- 
ereignisse gleich wahrscheinlich sind. Diese Voraussetzung war in den angegebenen 
Beispielen selbstverständlich, sie braucht aber nicht immer erfüllt zu sein. 
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1.5. Die bedingte Wahrscheinlichkeit 


V Beispiel 1.5.1. MARKOFF [4] untersuchte die Wahrscheinlichkeit für das Auftreten der 
folgenden Buchstabenpäare in der russischen Sprache: 


Selbstlaut nach Selbstlaut 
Selbstlaut nach Mitlaut. 


Zu diesem Zweck zählte er die entsprechenden Buchstabenpaare und berechnete deren Häu- 
tigkeit in Puschkıns Versroman „Eugen Onegin“, und zwar in einem Textabschnitt, der 20000 
Buchstaben umfaßte. Diese beobachteten Häufigkeiten betrachtete er als Wahrscheinlichkei- 
ten.) Die Untersuchung ergab Folgendes: Es waren an Selbstlauten 3638 vorhanden, dabei 
kam das Paar ‚‚Selbstlaut nach Selbstlaut‘‘ 1104mal vor. 


Wir wollen dieses Beispiel näher betrachten. Mit «a sei ein Selbstlaut, mit b 
ein Mitlaut bezeichnet. Als Elementarereignisse sehen wir die Paare aa, ba, ab, 
bb an, also als Menge E die Menge (as, ba, ab, bb). 

Das Ereignis B bestehe im Auftreten eines Buchstabenpaares, das an zweiter 
Stelle einen Selbstlaut hat. Das Ereignis B kann man in Form der Menge (aa, ba) 
schreiben. Man weiß, daß Selbstlaute (a) im ganzen 8638mal vorkommen. Den 
Selbstlauten geht entweder ein Selbstlaut voraus (die Paare a@) oder ein Mitlaut 
(die Paare ba). 

Da am Anfang des untersuchten Textes: 


„Moi AARA CAMEIX YeCTHBIX IPABul...“ 


kein Selbstlaut steht, kommt also das Ereignis B genau 8638mal vor. Des- 
halb ist 
P(B) = Aerr. 0,432 
20000 

Ferner bestehe das Ereignis A im Vorkommen eines Buchstabenpaares, das 
an erster Stelle einen Selbstlaut hat. Das Ereignis A kann man in Form der 
Menge (aa, ab) schreiben. 

Die Frage nach der Häufigkeit eines Selbstlautes unter der Bedingung, daß 
ihm ein Selbstlaut folgt, kann man auch folgendermaßen formulieren: 

Wie groß ist die Wahrscheinlichkeit des zufälligen Ereignisses A unter der 
Bedingung, daß das zufällige Ereignis B eingetreten ist? Es handelt sich hier 
nicht um die Wahrscheinlichkeit des Ereignisses A, betrachtet in der ganzen 
Menge E der Elementarereignisse, sondern um die bedingte Wahrscheinlichkeit. 
Dieser entspricht die bedingte Häufigkeit des Ereignisses A, und zwar unter der 
Bedingung, daß das Ereignis B eintrat. Es handelt sich also um die Wahrschein- 
lichkeit des Ereignisses A in der Menge (aa, ba), die hier als Menge.der Elementar- 
ereignisse betrachtet wird. 


1) Im zweiten Teil dieses Buches geben wir Methoden an, die es erlauben; die Berechtigung 
derartiger Hypothesen nachzuprüfen. 


3*F 
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In unserem Beispiel geht'es um die Wahrscheinlichkeit von (aa). Die Untersuchung erwies, 
daß dieses Ereignis im. ganzen 1104mal vorkommt; da aber das Ereignis B genau 8638mal 
vorkommt, beträgt die gesuchte bedingte Wahrscheinlichkeit 

1104 

—— = 0,128. 

8638 
B. Es sei B ein zufälliges Ereignis in einer gewissen Menge E von Elementar- 
ereignissen. Die Menge B ist also ein Element des Borelschen Mengenkörpers Z, 
der aus Teilmengen der Menge E besteht. Es sei P(B) > 0. Wir betrachten B 
als neue Menge von Elementarereignissen und bezeichnen mit Z’ den Borelschen 
Mengenkörper, der aus allen zum Körper Z gehörenden Teilmengen von B ge- 
bildet ist. | 

Wir betrachten ein beliebiges, zum Körper Z gehörendes Ereignis A. Es kann 
in einem besonderen Fall zum Körper Z’ gehören, nämlich dann, wenn es eine 
Teilmenge von B ist. Enthält dagegen A Elementarereignisse der Menge E, die 
nicht zu B gehören, dann gehört A auch nicht zum Körper Z’. Ein gewisser 


Abb. 1.5.1 


Teil der Menge A kann aber ein zufälliges Ereignis in Z’ sein, nämlich dann, 
wenn A und B gemeinsame Elemente in E besitzen, d.h., wenn das Produkt 
AB nicht die leere Menge ist. 

Es bezeichne B jetzt ein bestimmtes Element des Mengenkörpers Z, wobei 
P(B)>0, während A alle möglichen Elemente von Z durchlaufen soll. Alle 
Elemente von Z’ sind dann Produkte der Form AB. Um zu betonen, daß wir das 
Produkt AB als Element von Z’ (und nicht als Element von Z) betrachten, 
bezeichnen wir es mit dem Symbol A|B und lesen: A unter der Bedingung B 
oder A, wenn B eingetreten ist. 

Enthält A das Ereignis B, dann ist A| B ein sicheres Ereignis (im Körper Z’). 

Wir wollen das Ereignis A|B an Abb. 1.5.1 erläutern. Hier bedeuten das 
Quadrat. E die Menge der Elementarereignisse und die Kreise A und B gewisse 
zufällige Ereignisse. Der schraffierte Bereich bedeutet das Ereignis B, während 
der karierte Bereich das zufällige Ereignis A| B bedeutet (das Ereignis A, wenn 
das Ereignis B eingetroffen ist). 

Die Wahrscheinlichkeit des Ereignisses A|B werden wir im Körper Z’ mit 
P(A]|B) bezeichnen und lesen: die bedingte Wahrscheinlichkeit des Ereignisses A 
unter der Bedingung B oder wenn .B eingetroffen ist. 
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Diese Wahrscheinlichkeit kann man, wie gleich gezeigt wird, durch den Wahr- 
scheinlichkeitsbegriff des Körpers Z bestimmen; man braucht also die Existenz 
der Wahrscheinlichkeit P(4|B) und deren Eigenschaften nicht besonders zu 
fordern. 


€. Um das Verständnis der Definition von P(A|B) zu erleichtern, stellen wir 
folgende Überlegungen an: 

Wir haben n Versuche unter gleichen Bedingungen ausgeführt und m-mal 
das Ereignis B erhalten. Außerdem haben wir noch bei& (k < m) der m Versuche, 
bei denen das Ereignis B eintrat, als Ergebnis das zufällige Ereignis A erhalten. 


Die Häufigkeit des Produktes AB beträgt 1 die des Ereignisses B beträgt 
f u 

48 während die Häufigkeit von A unter der Bedingung, daß B eingetroffen ist, La 
n m 


beträgt. z 
Die Tatsache, daß die Gleichung 


1.5.1) 


gilt, legt, wenn wir die Eigenschaft (1.5.1) der Häufigkeiten auf die Wahrschein- | 
lichkeiten dieser Ereignisse übertragen, die folgende Definition nahe: 


Definition 1.5.1. Die Wahrscheinlichkeit des Ereignisses B sei positiv. Die 
bedingte Wahrscheinlichkeit des Ereignisses A unier der Bedingung B ist gleich 
dem Quotienten aus der Wahrscheinlichkeit des Produktes AB und der Wahr- 
scheinlichkeit des Ereignisses B. 


Somit ist 
_P(4AB) 
| P(AlB) = PB wenn P(B)>0. (1.5.2) 
Analog ist 
_ P(AB) h 
P(Bi4) = Pia)’ wenn P(4)>0. (1.5.3) 


Aus den Formeln (1.5.2) und (1.5.3) erhalten wir 
P(AB) = P(B)P(4|B) = P(A) P(B|A). (1.5.4) 


Diese Formel lesen wir: Die Wahrscheinlichkeit des Produktes AB zweier Er- 
eignisse ist gleich dem Produkt der Wahrscheinlichkeit des Ereignisses B mit der 
bedingten Wahrscheinlichkeit des Ereignisses A unter der Bedingung B — oder — 
gleich dem Produkt der Wahrscheinlichkeit von A mit der bedingten Wahrschein- 
lichkeit von B unter der Bedingung A. 
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Mit A,, A,, A, seien drei zufällige Ereignisse bezeichnet, die derselben Menge 

Z der zufälligen Ereignisse angehören. Wir betrachten den Ausdruck P(A,|A,4,), 

. die Wahrscheinlichkeit des Ereignisses A,, wenn das Produkt A, A, eingetroffen 
ist. Nach (1.5.2) ist diese Wahrscheinlichkeit gleich 


P(4,424,) 


P(431414,) = P(A,4,) B 
ıfa 


(1.5.5) 


wobei selbstverständlich P(4A,A,) > 0 vorausgesetzt ist. 
Aus (1.5.5) und (1.5.3) erhalten wir für die Wahrscheinlichkeit des Produkts 
dreier Ereignisse die Beziehungen 


P(4,4,4,;) = P(4,4,) P(A,| A143) — P(4,) P(4,|4,) P(43|Aı4,). 
(1.5.6) 


Diese Formel lesen wir: Die Wahrscheinlichkeit des Produkts dreier Ereignisse 
ist gleich der Wahrscheinlichkeit des ersten Ereignisses, multipliziert mit der be- 
dingten Wahrscheinlichkeit des zweiten Ereignisses, wenn das erste eingetroffen ist, 
und der bedingten Wahrscheinlichkeit des dritten Ereignisses, wenn das Produkt 
der ersten beiden Ereignisse eingetroffen ist. 

Es seien A,, A, ..., A, zufällige Ereignisse. Wir wollen die bedingte Wahr- 
scheinlichkeit P(A,A,, Ar |Ax,,,''"As,) des Produkts einer Untergruppe von 
r Ereignissen (l<r<n — 1) unter der Bedingung betrachten, daß das Produkt 
der übrigen,n — r Ereignisse eingetroffen ist. Eine ähnliche Überlegung wie 
vorher führt zur Formel 


P(A, 42-4.) = P(4,) P(4,14,) P(A3|A1Ag)--P(AulAr Ana): 
(1.5.7) 


.D. Wir wollen zeigen, daß die bedingte Wahrscheinlichkeit die Axiome I bis III 
erfüllt. 
Die Ungleichung 


P(AB)< P(B) (1.5.8) 


folgt sofort aus Satz 1.3.6, da offensichtlich AB < B ist. 
Wegen P(AB)= 0 und P{B) > 0 erhalten wir aus (1.5.8) die Formel 


0<P(A|B)<1. 


Also erfüllt die bedingte Wahrscheinlichkeit P(A|.B) das Axiom I. 


ES sei A|B das sichere Ereignis (im Körper Z'), also AB=B. In diesem 
Fall ist 


P(AB)=P(B), 
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folglich 
P(4|B) =1. 


Also ist auch das Axiom II erfüllt. 
Wir betrachten die Summe »(4A,|B) einander paarweise ausschließender 
Ereignisse. Wir können dafür £ 
ZAIB) = (ZA) IB, 
also 


ag) rg) 
schreiben. Aus Formel (1.5.2) sowie aus Axiom III folgt 


P 4;\B 4A;B 
Big (ee gr ne Kais 
Damit ist die vollständige Additivität der bedingten Wahrscheinlichkeiten, 
d.h. die Gültigkeit des Axioms III gezeigt. 
Da die bedingte Wahrscheinlichkeit alle Axiome erfüllt, gelten auch alle 
Sätze, die man aus diesen Axiomen herleiten kann, für bedingte Wahrscheinlich- 
keiten. 


1.6. Der Satz von Bayes 


A. Bevor wir allgemeingültige Überlegungen anstellen, wollen wir ein Beispiel 
betrachten. 


Beispiel 1.6.1. Wir haben zwei Urnen vor uns. In der ersten befinden sich drei weiße und 
zwei schwarze Kugeln und in der zweiten eine weiße und vier schwarze. Aus einer willkürlich 
gewählten Urne greifen wir blindlings eine Kugel heraus. Wie groß ist die Wahrscheinlichkeit, 
eine weiße Kugel herauszugreifen, wenn die Wahrscheinlichkeit, irgendeine der beiden Ur- 
nen zu wählen, je 0,5 beträgt? 

Wir bezeichnen mit A, bzw. A, die entsprechenden Ereignisse, die darin bestehen, daß wir 
irgendeine Kugel aus der ersten bzw. aus der zweiten Urne herausgreifen, und mit B das Er- 
eignis, daß wir eine weiße Kugel herausgreifen. Das Ereignis B kann entweder gemeinsam 
mit dem Ereignis A, oder mit dem Ereignis A, eintreten. Somit haben wir 


B=4A,B-+ 4,B 
und, da sich die Ereignisse A,B und A,B gegenseitig ausschließen, 
P(B) = P(A,B) + P(A,B). 
Wenn wir die Formel (1.5.4) anwenden, erhalten wir 


P(B) = P(A,) P(B|A,) + P(4,) P(BIA)). (1.6.4) 
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Für. unser Beispiel ist P(A,)= P(4,)=0,5, P(B|4,)=0,6 und P{B|A,) = 02. 
Setzen wir diese Werte in die Formel (1.6.1) ein, so erhalten wir P(B) = 0,4. E 


Die im letzten Beispiel erhaltene Formel ist ein Sonderfall des Satzes über 
die totale Wahrscheinlichkeit, den wir jetzt angeben wollen: 


Satz 1.6.1. Wenn die zufälligen Ereignisse A,, Aa, ... einander paarweise 
ausschließen und die Menge E der Elementarereignisse ausschöpfen, wobei 
P(4)>0 füri=1,2,..., dann giüt für ein beliebiges zufälliges Ereignis B 
die Gleichung 


P(B) = P(A,) P(B|A,) + P(A,) P(B|A,) +. (1.6.2) 


In der Tat folgt aus den Voraussetzungen, daß das Ereignis B nur gemeinsam 
mit genau einem der Ereignisse A, eintreffen kann. Es ist &lso 


B=4B+AB+-- 
sowie 
P(B) = P(A,B) + P(A,B) ti. (1.6.3) 


‘ Laut (1.5.4) erhalten wir für jedes © die Gleichung 


P(A,B) = P(A,)P(B|A)). (1.6.4) 


Wenn wir für P(A;B) die Ausdrücke (1.6.4) in die Formel (1.6.3) einsetzen, er- 
halten wir (1.6.2). 


B. Im folgenden mögen die Ereignisse A; und B die in der Voraussetzung zu 


Satz 1.6.1 aufgeführten Eigenschaften haben. Wir stellen uns vor, daß das - 


Ereignis B eingetreten ist. Wie groß ist dann die Wahrscheinlichkeit des Er- 
eignisses A;? Eine Antwort auf diese Frage gibt der folgende Satz von Bayzs: 


Satz 1.6.2. Erfüllen A,, As... und B die Vorausseizungen des Salzes über 
die totale Wahrscheinlichkeit und ist P(B) > 0, so gilt füri = 1,2, ... die Formel 


P(4A,) P(BIA,) 


FAB= SC) PBIA) + Pia) PiBlA) F- 


Setzen wir nämlich in der Formel (1.5.4) A; statt 4, so erhalten wir 


Pia) PA PBIA) 
P(B) 
Wenn wir noch im Nenner den Ausdruck P(B) durch die rechte Seite der Formel 
(1.6.2) ersetzen, erhalten wir (1.6.5). 
Die Formel (1.6.5) ist nach Bayzs benannt. Man bezeichnet sie auch als Formel 
für die Wahrscheinlichkeit a posteriori. Dieser Name erklärt sich daraus, daß 


(1.6.5) - 
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diese Formel die Wahrscheinlichkeit der Realisierung des Ereignisses A, nach. 
dem Eintreffen von B angibt. Im Gegensatz zur Wahrscheinlichkeit P(4,|B) 
nennen wir den in dieser Formel auftretenden Ausdruck P(4A,)Wahrscheinlichkeit 
a priori. 

In den Anwendungen spielt die Bayessche Formel eine große Rolle. 


Beispiel 1.6.2. Die Geschütze Nr. 1 und Nr. 2 feuern auf dasselbe Ziel. Man hat fest- 
‚gestellt, daß das Geschütz Nr. 1 durchschnittlich neun Schüsse abgibt in der Zeit, in’ der das 

Geschütz Nr. 2 zehn Geschosse abfeuert. Die Treffsicherheit der beiden Geschütze sei nicht 
dieselbe; vom Geschütz Nr. 1 treffen nämlich durchschnittlich 8 von 10 Geschossen das Ziel, 
während vom Geschütz Nr. 2 nur 7 von 10 das Ziel treffen. 

Während des Beschusses wurde nun das Ziel von einem Geschoß getroffen, man weiß 
aber nicht, aus welchem Geschütz dieses Geschoß stammt. Wie groß ist die Wahrscheinlichkeit 
dafür, daß dieses Geschoß vom Geschütz Nr. 2 abgeschossen wurde? 

Wir bezeichnen mit A, bzw. A, die Ereignisse, die darin bestehen, daß das Geschütz Nr. i 
bzw. Nr. 2 ein Geschoß abschießt. Das Verhältnis der durchschnittlichen Geschoßanzahl des 
Geschützes Nr. 1 pro Zeiteinheit zur durchschnittlichen Geschoßanzahl des Geschützes 
Nr. 2 pro Zeiteinheit beträgt 9/10 = 0,9. Wir nehmen deshalb an,daß P(A,) = 0,9 P (4,) ist.!) 
Weiter bezeichne B das Ereignis, das darin besteht, daß irgendein Geschoß das Ziel trifft. Auf 
Grund der Angaben, die wir über die Treffsicherheit der Geschütze besitzen, setzen wir 
P(B|A,) = 0,8 und P(B|A,) = 0,7. 

Die Bayessche Formel ergibt 


_ P(4,)P(B|A,) 
P(A,)P(BIA,) + P(4,)P(B1A,) 

5 0,7P(A,) 

-0,9P(4,) 0,8 + 0,7P(A,) 


P(4,|B) 


= 0,493. 


t.7. Unabhängige Ereignisse 


A. Die bedingte Wahrscheinlichkeit P(A|B) ist im allgemeinen verschieden 
von P(A). Besonders wichtig ist nun der Fall, daß beide gleich sind: 


P(A|B)=P(A). (1.7.1) 


In diesem Fall hat die Tatsache, daß das Ereignis B eingetroffen ist, keinerlei 
Einfluß auf die Wahrscheimlichkeit des Ereignisses A, oder anders gesagt: Die 
Wahrscheinlichkeit des Ereignisses A hängt nicht davon ab, ob das Ereignis B 
eingetroffen ist oder nicht. 

Aus (1.5.4) erhalten wir, wenn die Beziehung (1.7.1) erfüllt ist, die Gleichung 


P(AB) =P(A)P(B). (1.7.2) 


1) Im zweiten Teil dieses Buches geben wir Methoden an, die es erlauben, die Berechtigung: 
derartiger Hypothesen nachzuprüfen. 
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Die Formel (1.7.2) gilt auch dann, wenn die Gleichung 
P(B|A)=P(B) (1.7.3) 


besteht. 

Wir leiteten (1.7.2) aus der Formel (1.5.4) her, wobei für die letzte die Annahmen 
P(A) > O und P(B) > 0 zu machen waren; die Formel (1.7.2) ist aberauchindem 
Fall sinnvoll, daß eine dieser Wahrscheinlichkeiten gleich Null ist. 

Wir definieren jetzt die Unabhängigkeit zweier zufälliger Ereignisse. 


Definition 1.7.1. Die Ereigrisse A und B sind voneinander unabhängig, 
wenn für ihre Wahrscheinlichkeiten die Formel (1.7.2) gilt, d.h., wenn die 
Wehrscheinlichkeit des Produkts AB gleich dem Produkt der Wahrscheinlich- 
+ keiten der Ereignisse A und B ist. 


Wie aus dieser Definition folgt, ist der Begriff der Unabhängigkeit zweier 
zufälliger Ereignisse symmetrisch in bezug auf diese Ereignisse. 

Wie wir schon bemerkten, können wir aus jeder der Formeln (1.7.1) und 
(1.7.3) die Formel (1.7.2) erhalten. Aus den Fo:meln (1.5.4) und (1.7.2) folgen 
unter der Annahme, daß P(A) > 0 und P(B) > 0, ebenfalls die Formeln (1.7.1) 
und (1.7.3). Daraus schließen wir: Jede der beiden letzten Formeln ist eine 
notwendige und hinreichende Bedingung für die Unabhängigkeit von zwei zu- 
fälligen Ereignissen, deren Wahrscheinlichkeiten positiv sind. 


B. Man kann die Unabhängigkeitsdefinition auf endlich oder abzählbar viele 
zufällige Ereignisse ausdehnen. 


Definition 1.7.2. Die zufälligen Ereignisse A,, Az, ..., A, sind voneinander 
unabhängig, wenn für beliebige ganze Indizes k,, ka, ..., k,, die die Bedingungen 


1<k<ky<--< Zn 
erfüllen, die Gleichung 
“ PA, Ay Ar) = P(Au) P(An)P(Ar) 


gilt, d.h., wenn die Wahrscheinlichkeit des Produkts A, A,,-A,, jeder Kombi- 
nation von Ereignissen gleich dem Produkt der Wahrscheinlichkeiten dieser 
Ereignisse ist. 

Es ist möglich, daß die Ereignisse A,, A,,...., A, zwar paarweise unabhängig 
sind (d.h., daß je zwei der Ereignisse voneinander unabhängig sind) oder zu 
dreien unabhängig sind (d.h., daß je drei Ereignisse voneinander unabhängig 
sind), die Ereignisse A,, As, ..., A, insgesamt aber nicht voneinander unabhängig 
sind. 

Ein Beispiel, das von S. BERNSTEIN angegeben wurde, soll das erläutern: 

Beispiel 1.7.1. In einer Urne befinden sich 4 Papierstreifen gleicher Größe. Jeder Papier- 


streifen ist mit einer der vier folgenden Aufschriften versehen: 110, 101, 011, 000, wobei nicht 
zwei Streifen die gleiche Aufschrift tragen. Das Ereignis A, bestehe im Herausgreifen eines 
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Streifens mit einer Aufschrift, die an erster Stelle eine Eins hat, das Ereignis A, im Ziehen eines. 
Streifens mit einer Eins an zweiter Stelle, A, im Ziehen eines Streifens mit einer Eins an dritter 
Stelle. Da für jede dieser Kategorien zwei Streifen vorhanden sind und da die Gesamtzahl der 
Streifen 4 beträgt, erhalten wir unter der Voraussetzung, daß die Wahrscheinlichkeit, gezogen 
zu werden, für alle Streifen dieselbe ist, 


1 
P(A,) = P(A,)=P(4)= 3 


Bezeichnen wir mit A das Produkt A, A, A,, so ist P(A) = 0; denn das Ereignis A ist un- 
möglich (auf keinem einzigen Papierstreifen befinden sich drei Einsen!). Wegen 


1 
BADEN EFT EA 


sind die Ereignisse A,, A,, A, nicht voneinander unabhängig. Aber wir werden zeigen, daß diese 
Ereignisse paarweise voneinander unabhängig sind. Für das Paar A,, A, gilt nämlich 


1 
P(4,|4,) = zZ —= P(A); 


denn es gibt nur zwei Streifen, die an erster Stelle eine Eins haben, und nur einer von ihnen hat 
an zweiter Stelle eine Eins. Ähnlich kann man die Unabhängigkeit der übrigen Paare nach- 
weisen. 


Die Unabhängigkeit abzählbar vieler zufälliger Ereignisse erklären wir folgender- 
maßen: 

Definition 1.7.3. Die zufälligen Ereignisse A,, As, A,,... sind voneinander 
unabhängig, wenn für jedes 2 = 2, 3,4, .... die Ereignisse A,,...., A„ voneinander 
unabhängig sind. 

Wie aus den Definitionen 1.7.3 und 1.7.2 folgt, sind, falls die zufälligen Er- 
eignisse A,, Ag, A,, ... voneinander unabhängig sind, auch für jedesn = 2, 3,4, ... 
und für beliebige Indizes k,, k,,...,%k, die Ereignisse A,,..., 4;, voneinander 
unabhängig. 

Um zu unterstreichen, daß die betrachteten Ereignisse nicht nur paarweise 
oder zu dreien usw. unabhängig sind, sondern im Sinne der Definition 1.7.2 
oder 1.7.3, wird in der Literatur zur Wahrscheinlichkeitsrechnung die Bezeichnung - 
unabhängig en. bloc oder in der Gesamtheit unabhängig oder insgesamt unabhängig 
gebraucht. Diese Ausdrücke woilen wir vermeiden und kurz unabhängig statt 
unabhängig en bloc sagen. 


18. Aufgaben und Ergänzungen 
1. Man zeige, daß die Operationen der Addition und Multiplikation zufälliger Ereignisse 
kommutativ sind und daß sie dem Assoziativgesetz sowie dem Distributivgesetz genügen: 
A+h=4+ 4, 
4,4, = AyA,, 
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4ı+ (Ad; +4)=(A + A,) + Az, 
A,(A2A;) = (A, A2) Az, 
Ayld; + A) = ArAa + Ars: 
2. Man beweise die Gleichungen 
4,4, = A, — (A, — A), 
4ı+ (4; — 4)= 4, +43, 
4 4= 4, Ada» 
Aı(A, Ze As) = A, Ay — A;. 
3. Manzeige,daß A, + A, = 4, und A,4A, = 4, gilt, wenn A, Az ist. 
4. a) Man zeige die Gültigkeit der de Morganschen Formeln 
A+4,= Ad, 
4,4, = A, #"4,. 
b) Man verallgemeinere diese Formeln für den Fall von n in > 2) zufälligen Ereignissen. 


‚5. a) Man zeige, daß für n = 2,3, ... die Gleichung 


4, +4, = A, + (4 AAd)t- + (An — AyAn u  — Andy) 
gilt. Wir weisen darauf hin, daß sich die Summanden auf der rechten Seite paarweise 
aufheben. 


b) Man zeige die Gültigkeit der Beziehung 


U4 = 4A, + (4, — 4,42) + (A, — AA; — As At 


i=1 
6. Man beweise, daß die Eigenschaften 1.2.2 und 1.2.5 aus den Eigenschaften 1.2.1, 1.2.3 und. 
‚1.2.4 folgen. 

7. Es sei {4,} (ns= 1,2,....) eine Folge zufälliger Ereignisse. Das zufällige Ereignis A*, das 
sämtliche Elementarereignisse enthält, die zu unendlich vielen A, gehören, heißt oberer 
Grenzwert der Folge {4,}: 

4A* = lim sup A,. 
n 
Das zufällige Ereignis A,, das. sämtliche Elementarereignisse enthält, die zu sämtlichen. 
A, mit Ausnahme von endlich vielen gehören, heißt unterer Grenzwert der Folge {A,}: 
Ay, = lim inf A,. 
n 
a) Man zeige, daß.die Beziehungen 
© 00 [0] 
#=]] SA» 4-3 11= 
n=1k-n n=1k=n 


gelten. 
b) Man beweise die Beziehung 
A, 4*. 
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8. Mit den Bezeichnungen der vorhergehenden Aufgabe nennt man A = A* = A,, falls 
A* = A, gilt, den Grenzwert der Folge {A„} und schreibt 
A=1imA,. . 


RX 
3) Man zeige, daß 
v oo 
A=4A,= At= YA, 
n=1 
gilt, wenn {A} eine’zunehmende Folge ist. 


b) Man zeige, daß 
i oo 
A= 4A,— 4*= ]]4, 


n=1 
gilt, wenn {A,„} eine abnehmende Folge ist. 


9. a) Man zeige, daß für eine beliebige Folge {A,} von zufälligen Ereignissen die folgenden 
‚Beziehungen gelten: 


en sup 4) > lim sup P(A,), 
no Nn>X 
Plim inf 4) < lim inf P(A,). 


Nn>00 Nn>X 
Hinweis. Man verwende die Sätze 1.3.4 und 1.3.5. 
b) Man beweise, daß 


P( lim Ar) = lim P(A,) 
Nn—>09 Nn>X 


gilt, wenn der Grenzwert lim A, existiert. 
NO " 


‘10. Unter Verwendung der Aufgaben 5a ürld 5b beweise man die Ungleichungen 


e(Ü 4) <SP(A), e(Ü 4) < N Pia). 
i=1 i=1 i=1 


In den nachstehenden kombinatorischen Aufgaben 11 bis 18 ist anzunehmen, daß sämtliche 
Systeme gleichwahrscheinlich sind. 


11. Ein Kartenspiel möge 52 Karten enthalten. Ein Spieler @ erhielt 13 Karten. Man berechne 
die Wahrscheinlichkeit dafür, daß @ folgende Karten erhält: 
a) genau drei Asse, 
. b) wenigstens drei Asse, 
c) irgendwelche drei gleiche Bilder, 
d) irgendwelche drei gleiche Karten aus den fünf höchsten Nennwerten, 
€) irgendwelche drei gleiche Karten aus den acht niedrigsten Nennwerten, 
f) irgendwelche drei Karten mit dem gleichen Nennwert, 
g) drei aufeinanderfolgende Karten der Farbe Pique, 
h) wenigstens drei aufeinanderfolgende Karten der Farbe Pique, 
i) drei aufeinanderfolgende Karten derselben (beliebigen Farbe), 
k) wenigstens drei aufeinanderfolgende Karten derselben (beliebigen) Farbe. 


46 1. Zufällige Ereignisse 


12. Drei Würfel werden einmal geworfen. Man berechne die Wahrscheinlichkeit dafür, daß 
man die folgenden Augenkombinationen erhält: 


a) auf einem Würfel zwei Augen, 

b) auf wenigstens einem Würfel drei Augen, 
c) eine gerade Augensumme, 

d) eine durch drei teilbare Augensumme, 

e) eine Augensumme, die größer ist als sieben, 
f) eine Augensumme, die kleiner ist als zwölf, 
g) eine Augensumme, die Primzahl ist. 


13. (Die Aufgabe des Chevalier de Mer.) Man stelle fest, welches der folgenden Ereignisse die . 
größere Wahrscheinlichkeit hat: 
a) beieinem gleichzeitigen Wurf mit vier Würfeln auf wenigstens einem Würfel die Augen- 
zahl 1 zu erhalten; . 
b) bei 24 Würfen mit gleichzeitig zwei Würfeln wenigstens einmal zwei Augen zu erhalten. 


14. (Das Banachsche Problem.) Ein Mathematiker trägt zwei Streichholzschachteln bei sich, 
von dehen jede ursprünglich r Streichhölzer enthielt. Jedesmal, wenn er sich eine Zigarette 
anzündet, wählt er eine Streichholzschachtel zufällig aus. Man berechne die Wahrschein- 
lichkeit dafür, daß bei eventueller Auswahl einer bereits leeren Schachtel in der anderen 
Schachtel noch r Streichhölzer vorhanden sind, r = 0,1, ...,n. 


15. Eine Urne enthält m weiße und n — m schwarze Kugeln. Zwei Spieler greifen nacheinander 
beliebig eine Kugel aus der Urne heraus und tun diese vor der Entnahme der nächsten 
Kugel in die Urne zurück. Der Spieler, dem es zuerst gelingt, eine weiße Kugel zu ziehen, 
hat das Spiel gewonnen. Man berechne die Wahrscheinlichkeit dafür, daß der beginnende 
Spieler gewinnt. 


16. In einer Urne mögen sich » Kugeln befinden. Wir entnehmen aus ihr eine beliebige Anzahl. | 
Man zeige, daß die Wahrscheinlichkeit, eine gerade Anzahl von Kugeln zu ziehen, sich zu 
an — 1 | 
m-ı 
ergibt. 
17. Eine Urne enthält n weiße und n schwarze Kugeln. Wir entnehmen der Urne auf beliebige 


‚ Art und Weise eine gerade Anzahl von Kugeln. Man zeige, daß die Wahrscheinlichkeit, 
eine gleiche Anzahl weißer und schwarzer Kugeln zu ziehen, 


(2n)! 


(my? 
gan-ı _ 1 


beträgt. 


18. Auf 28 Karten ist je ein Buchstabe eingetragen. Die dabei auftretenden Buchstaben und 
deren jeweilige Vielfachheit sind in der nachstehenden Tabelle angegeben: 


Buchstabe | a |e Je| hi | 5] 
Vielfachheit| 3 | ı |s | ı | ı | 2| 


v 
I4l2l: 


l o|s 
2.22 
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19. 


20. 


21. 


23. 


24. 


25. 


Die Karten werden dann in einer beliebigen Reihenfolge angeordnet. Wie groß ist die Wahr- 
scheinlichkeit dafür, daß sich hierbei der Satz: „sto lat, sto lat niech öyje, zyje nam“ 
ergibt?!) 

GOETHE schenkte einst dem bekannten Chemiker Rungz, der bei ihm zu Besuch weilte, 
eine Büchse mit Kaffeebohnen, ein Geschenk, das zu jener Zeit äußerst wertvoll war. 
Runge verwandte seinen Inhalt für wissenschaftliche Zwecke, und es gelang ihm als 
erstem, reines Koffein. darzustellen. Läßt sich die Wahrscheinlichkeit dieses Ereignisses 
berechnen und, wenn ja, ist dieses Ergebnis eindeutig? Wovon hängt die präzise Formu- 
lierung des zufälligen Ereignisses ab, dessen Wahrscheinlichkeit wir suchen? 


(Das Bertrandsche Paradoxon.) Einem Kreis sei ein gleichseitiges Dreieck mit der Seiten- 
länge a einbeschrieben. Dann wird im Kreis eine beliebige Sehne gezogen. Das Ereignis A 
besteht darin, daß die Länge / der Sehne der Bedingung 7 > « genügt. Man ermittle die 


1 i 
Bedingungen, unter denen a) P(a) = 0,5, b) P(a)= — und ce) Pfa) = — ist. Sind diese 
Ergebnisse als widersprüchlich aufzufassen? i = 
(Die Buffonsche Aufgabe.) Eine Nadel von der Länge 2 wird in beliebiger Weise auf eine 


waagerechte Ebene geworfen, in der parallele Geraden im Abstand 2a (a > I) gezogen 
sind. Wie groß ist die Wahrscheinlichkeit dafür, daß die Nadel eine der Geraden schneidet? 


. Die Wahrscheinlichkeit dafür, daß unter Zwillingen beide Kinder Knaben sind, ist 0,32, 
während die Wahrscheinlichkeit dafür, daß beide Mädchen sind, 0,28 beträgt. Man be- 
. stimme die bedingte Wahrscheinlichkeit dafür, daß 


&) das zweite Kind unter Zwillingen ein Knabe ist, wenn bereits das erste ein Knabe ist; 
b) das zweite Zwillingskind ein Mädchen ist, wenn bereits das erste ein Mädchen ist. 


Hinweis. Man verwende das Beispiel 1.1.3. 


a) Wie oft muß ein Würfel geworfen werden, damit die Wahrscheinlichkeit für das wenig- 
3 
stens einmalige Auftreten der Augenzahl 6 nicht kleiner als Fi ist? 


b) Die Ereignisse A,, A,, ... seien unabhängig, wobei P(A)=p (= 1,2,...) gilt. Man 
bestimme den Wert n, für den die Beziehung 


n 

P | U 4) = Po 
k=1 

erfüllt ist, wobei 9, eine beliebig vorgegebene Zahl bedeutet. 


a) Die Ereignisse A,, Az, ..., A, seien unabhängig, und es sei hierbei P(A,) = p;,. Wie 
groß ist die Wahrscheinlichkeit dafür, daß keines der Ereignisse A, eintritt? 
b) Man lasse die Unabhängigkeitsvoraussetzung fallen und beantworte dann die Frage. 


Man zeige, daß bei unabhängigen zufälligen Ereignissen A und B auch Ä und Z unabhän- 
gig sind. i 


!) Es handelt sich um den Anfang eines polnischen Liedes, das unserem „Hoch soll er 


leben“ entspricht und etwa lautet: „Hundert Jahre, hundert Jahre alt möge er werden.“ 


2. ZUFALLSVARIABLE 


2.1. Der Begriff einer Zufailsvariablen 


Jedem Elementarereignis, das zu. einer gewissen Menge E gehört, können wir 
irgendeine Zahl zuordnen. So ordnen wir z.B. beim Werfen einer Münze dem 
Auftreten des Adlers die Eins und dem Auftreten der Zahl die Null zu. Die Wahr- 
scheinlichkeit dafür, daß wir als Versuchsergebnis die Eins erhalten, ist gleich 
der Wahrscheinlichkeit, daß die Münze beim Auffallen den Adler zeigt; ebenso 
ist die: Wahrscheinlichkeit, die Null zu erhalten, gleich der Wahrscheinlichkeit 
dafür, daß die Münze beim Auffallen die Zahl zeigt. 

Ebenso kann man beim Würfeln den einzelnen Elementarereignissen, die 
hier im Auftreten einer der Augenzahlen 1, 2, 3, 4, 5, 6 bestehen, eben diese 
Zahlen zuordnen, Allgemein sei durch e ein Elementarereignis bezeichnet, das zur 

: Menge E der Elementarereignisse gehört. Auf der Menge E definieren wir eirie 
eindeutige reelle Funktion derart, daß — wir drücken uns vorläufig ganz un- 
exakt aus — die Wahrscheinlichkeit, mit der diese Funktion gewisse Werte an- 
nimmt, bestimmt ist. Um die Bedingungen, denen diese Funktion genügen soll, 
genauer formulieren zu können, führen wir erst den Begriff des Urbildes ein. 


Definition 2.1.1. Es sei X(e) eine eindeutige reelle Funktion, die auf der 
Menge E der Elementarereignisse definiert ist. Als Urbild einer gegebenen 
Menge $ von reellen Zahlen bezeichnen wir die Menge A aller derjenigen Elemen- 
tarereignisse e, denen die Funktion X (e) Werte aus der Menge $ zuordnet. 

Wir schreiben hierfür 


A=X-1(8). 


Man sieht leicht, daß das Urbild der Menge E aller reellen Zahlen die Menge E 
ist: E = X-UR). 

Ist $S eine gewisse Menge reeller Zahlen auf der x- Achse, so bedeute das Symbol 
P@) (8) die Wahrscheinlichkeit dafür, daß die Funktion X(e) einen Wert aus & 
annimmt: 


PS) = PO (X(e)e 8). 


Definition 2.1.2. Wir nennen eine eindeutige reelle Funktion X (e), die auf 
der Menge E aller Elementarereignisse e definiert ist, eine Zufallsvariable!), 


1) Dem Begriff einer Zufallsvariablen entspricht in der Theorie der reellen Funktionen 
der Begriff einer (hinsichtlich des betrachteten Mengenkörpers) meßbaren Funktion. 


2.1. Der Begriff einer Zufallsvariablen 


Ha 
En 


wenn das Urbild A eines jeden reellen Zahlenintervalls / der Form (— oo, x) ein 
zufälliges Ereignis ist. 

Die Währscheinlichkeit P®(I) dafür, daß die Zufallsvariable X (e). einen 
Wert aus dem Intervall I annimmt, setzen wir gleich der Wahrscheinlichkeit 
P(4), wobei A.das Urbild des Intervalls I ist. 

Von jetzt an wollen wir gewöhnlich X statt X(e) schreiben und uns merken, 
daß die Funktion X auf der Menge E der Elementarereignisse definiert ist. 

Zufallsvariable bezeichnen wir gewöhnlich mit großen Buchstaben X, Y, ..., 
während wir die Werte, die sie annehmen, mit den entsprechenden. kleinen 
Buchstaben x, y, ... bezeichnen. 

Aus der Definition 2.1.2 folgt insbesondere: Ist das zufällige Ereignis A das 
Urbild eines Punktes x, dann ist die Wahrscheinlichkeit dafür, daß die Zufalls- 
variable X den Wert x annimmt, gleich der Wahrscheinlichkeit des Ereignisses A: 


PX =2)=P(A). 


Da ein jedes halboffene Intervall I der Form [a, b) mit@ < 5 gleich der Differenz 
der Intervalle (—oo,.b) und (—oo, a) ist, folgt aus der Definition 2.1.2 die Existenz 
der Wahrscheinlichkeit P®(7). Wie man zeigen kann, ist das Urbild der Ver- 
einigung, der Differenz bzw. des Durchschnitts von beliebigen Intervallen gleich 
der Vereinigung, der Differenz bzw. dem Durchschnitt der Urbilder dieser 
Intervalle. . i 

Jede Borelsche Menge von reellen Zahlen kann man als Ergebnis endlich 
oder abzählbar vieler Operationen wie Vereinigungsbildung, Differenzbildung 
oder Durchschnittsbildung, ausgeführt an rechtsseitig halboffenen Intervallen, 
auffassen (siehe auch Anhang, Beispiel A 2). 

Aus den Eigenschaften der Menge Z der zufälligen Ereignisse sowie aus den 
Eigenschaften der Wahrscheinlichkeit, die in Kapitel i besprochen wurden, | 
und endlich aus der Definition der Zufallsvariablen folgt: Isi X eine Zufellsvariable, 
so ist für jede Borelsche Menge S auf der x-Achse die Wahrscheinlichkeit P®(#\ 
dafür definiert, daß X einen Wert annimmt, der der Menge 5 angehört. Mit anderen 
Worten: Die Wahrscheinlichkeitsverteilung der Zufallsvariablen X ist bestimmt 
(siehe Anhang, Satz über die Erweiterung). Statt Wahrscheinlichkeitsverteilung 
der Zufallsvariablen X wollen wir kürzer Verteilung der Zufallsvariablen X sagen. 

Definition 2.1.3. Die Funktion P®($), die gleich der Wahrscheinlichkeit 
dafür ist, daß die Zufallsvariable X einen zu $ gehörigen Wert annimmt, wobei 
S eine beliebige Borelsche Menge der x-Achse ist, nennen wir die Wahrscheinlich- 
keitsfunktion der Zufallsvariablen X. 

Wir schreiben 


Pa)(8) = Pa(Xe8). 


In den Anwendungen werden wir es meistens mit einfachen Zahlenmengen 
zu tun haben, z. B. mit Intervallen oder endlichen Summen von Intervallen. 


4 Fisz 
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Aus der Definition der Zufallsvariablen ersieht man, daß sie eine Funktion 
und nicht eine Variable im gewöhnlichen Sinne der Analysis ist. Diese Bemerkung 
ist sehr wichtig und ständig zu beachten. Insbesondere muß man sehr vorsichtig 
sein, wenn man formale Eigenschaften von Operationen mit Variablen auf Opera- 
tionen mit Zufailsvariablen übertragen will. 

Hier in 2.1, in 2.5.A und im Anhang verwenden wir das Symbol P® zur Be- 
zeichnung der Wahrscheinlichkeiten für Zufallsvariable und damit für Er- 
eignisse, die Teilmengen einer neuen Menge X (B) von Elementarereignissen sind, 
während das Symbol P für zufällige Ereignisse verwendet wurde, die Teilmengen 
der ursprünglichen Menge E waren. Im übrigen Teil des Buches ist eine derartige 
Unterscheidung nicht erforderlich, weshalb dort durchgängig das Symbol P 
benutzt wird. 


2.2. Die Verteilungsfunktion 


Es ist bequem, die Wahrscheinlichkeitsverteilung mit Hilfe einer sogenannten 
Verteilungsfunktion zu charakterisieren. Wir wollen diesen Begriff an einem 
Beispiel erläutern. 


Beispiel 2.2.1. Wir betrachten Würfe mit einem Würfel. Den Elementarereignissen, die 
im Erscheinen der Zahlen 1, 2, 3, 4, 5, 6 bestehen, ordnen wir die gewürfelte Zahl zu. Die 
Zufallsvariable X kann hier die sechs Werte ,=t k =1,...,6) mit derselben Wahrschein- 
lichkeit P(X = x,) = 1/6 annehmen. 

Die Wahrscheinlichkeit dafür, daß X < 1, ist natürlich gleich Null: 

PXR<N=0. } 


Wenn x eine Zahl ist, die der Ungleichung 1 < x = 2 genügt, so ist 
i 

PX<9)=-Pl=)=-3: 

Falls 2<x= 3 ist, so sehen wir leicht ein, daß 


i 


PX<2)=PX=1)+PX=2)= 


Wenn wir schließlich 5 < x s 6 nehmen, erhalten wir 


’ 5 5 
PX<2)=-YV PX =)=-— 
=ı 6 
undendlich für x > 6 
6 
PX<)=-PX<SÖ)=YPX=)=1. 


i=1 


Stellen wir bei diesem Beispiel die Werte P(X < x) als Funktion der Variablen x graphisch 
dar, so erhalten wir eine Treppenlinie (Abb. 2.2.1). 
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Wie wir sehen, nimmt mit wachsendem x der Wert P(X < x) nicht ab, und in den Punkten 
x; =1,...,6) wächst dieser Wert um die Größe? (X =x,) an. 


Definition 2.2.1. Die durch die Formel 
Fix) = P(X <a) (2.2.1) 


definierte Funktion nennen wir die Verteilungsfunktion der Zufallsvariablen X.!) 


PfX<x} | 
ER I RERSIREBSBEIER — 
sl 
ö 
A — 
i a 
ö 
| — 
1 1 
5 H ® ) 


2 7 
Abb. 2.2.1 


Wie man sieht, bestehen die Gleichungen 
F(-)=0, F(o)=1. ö (2.2.2) 


Wir zeigen, daß die Verteilungsfunktion F(x) nicht fallend ist. Es seien x, 
und x, Punkte auf der x-Achse, wobei x, <x,. Da das Intervall (—oo, 2,) das 
Intervall (— oo, x,) enthält, ist P(X <x,) > P(X <x,), also 


F(2)> Fi). 


Wir zeigen jetzt, daß die Verteilungsfunktion wenigstens linksseitig stetig 
ist. Esseix, <2, < ...< x eine beliebige wachsende und gegen x konvergierende 
Zahlenfolge. Mit A, bezeichnen wir das Ereignis, daß die Zufallsvariable X 
einen Wert annimmt, der zum halboffenen Intervall [x;, x) gehört. Ist k, <k, 
so folgt aus dem Eintreffen des Ereignisses A,, das Eintreffen von A,.. Es ist also 
{A,} eine absteigende Folge von Ereignissen. Der Grenzwert der Folge {x;}, der 


1) Manche Autoren definieren die Verteilungsfunktion durch die Formel 


F(ia)=P(Xse). 


4* 
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Punkt x, gehört zu keinem der betrachteten Intervalle. Deshalb ist es unmöglich, 
daß die Zufallsvariable X einen zu allen Intervallen [x,, x) gehörigen Wert an- 


nimmt. Daraus folgt, daß das Produkt A = // A, ein unmögliches Ereignis ist, 
k=1 
daß also P(4) =. Somit erhalten wir aus Satz 1.3.4 


lim P(A,) = us Pa. sX<e) =lm[F(e) — F(xr)] 


k->00 > ko00 
— ee — lim FF) = 0 
oder = 
lim F(&,) = Fe). 
k>00 
Da die Folge {x,} eine beliebige wachsende, von links gegen x konvergierende 
Folge war, folgt aus der letzten. Gleichung die linksseitige Stetigkeit von F(x). 
Wie wir jetzt zeigen wollen, bestimmt jede reelle nichtfallende und wenigstens 
linksseitig stetige Funktion F(x), die den Beziehungen (2.2.2) genügt, die Wahr- 
scheinlichkeitsverteilung einer gewissen Zufallsvariablen. Dazu nehmen wir an, 
F(x) erfülle die aufgezählten Bedingungen. Als Menge der Elementarereignisse 
_ wählen wir dann das Intervall [0, 1], als Menge der zufälligen Ereignisse die Klasse 
aller Borelschen Mengen, die aus Punkten dieses Intervalls gebildet werden 
können, und als Wahrscheinlichkeit das normierte Lebesguesche Maß, d. h., wir 
sehen als Wahrscheinlichkeit einer Borelschen Menge aus [0, 1] das Lebesguesche 
Maß dieser Menge an. Insbesondere ist also die Wahrscheinlichkeit des Intervalls 
[0, e), wobei 0 <es1, gleich der Länge e dieses Intervalls. Die Zufallsvariable 
X (e) definieren wir durch 


X(e) = inf y (sesi1l). 
Fop=e 
Für ein gegebenes e ist also die Zufallsvariable X (e) gleich der unteren Schranke 
aller derjenigen y, für welche F(y) = e ist. Damit haben wir auch erreicht, daß 
die Verteilungsfunktionen der so definierten Zufallsvariablen X(e) gleich der 
Funktion F (x) ist, denn wir erhalten 


P((X(e) <«)) Ze, = F(«) (em <a <o). 
y)=e 


Wir haben also bewiesen: 


Satz 2.2.1. Eine reelle eindeutige Funktion F (x) ist genau dann eine Verteilungs- 
funktion, wenn sie 
1. nicht fallend und wenigstens linksseitig stetig ist, 
2. die Bedingungen (2.2.2) erfüllt. 


Aus diesem Ergebnis folgt sofort: Die Verteilungsfunktion wird durch die 
Werte in ihren Stetigkeitsstellen bestimmt. 
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Wir wollen noch zeigen, daß die Menge H aller Unstetigkeitsstellen einer 
Verteilungsfunktion. höchstens abzählbar ist. Dazu bezeichnen wir mit H,„ die 
Menge aller derjenigen Punkte x, in denen die Verteilungsfunktion F(x) einen 


Sprung größer oder gleich ı besitzt. Dann ist 
mn 


H=HUHRU-. 


Da für jedes 2 die Menge HZ, endlich ist, ist H höchstens abzählbar. 


2.3. Diskrete und stetige Zufallsvariable 


A. Gewöhnlich beschäftigen wir uns mit zwei Arten von Zufallsvariablen: den 
diskreten und den stetigen Zufallsvariablen. 


Definition 2.3.1. Eine Zufallsvariable, die mit der Wahrscheinlichkeit 1 
Werte aus einer gewissen endlichen oder höchstens abzählbar unendlichen Menge 
S annimmt, wobei jeder Wert aus S eine positive Wahrscheinlichkeit hat, nennen 
wir diskret. Diese Werte nennen wir Sprungstellen und ihre Wahrscheinlichkeiten 
Sprunghöhen. 


Beispiel 2.3.1. Eine Warenladung enthält fehlerlose und fehlerhafte Stücke. Wir betrach- 
ten zwei Elementarereignisse, die Wahl eines fehlerlosen und die eines fehlerhaften Exemplars. 
Die Wahrscheinlichkeit, ein fehlerloses Stück zufällig zu wählen, bezeichnen wir mit p, wobei 
wir voraussetzen, dß 0<p<1 ist. Der Auswahl eines fehlerlosen Stückes aus dieser 
. Ladung ordnen wir die Zahl Eins und der Auswahl eines fehlerhaften Stückes die Zahl Null zu. 
Wir erhalten eine diskrete Zufallsvariable, die mit positiver Wahrscheinlichkeit nur zwei Werte 
annehmen kann: 1.und 0, den ersten mit der Wahrscheinlichkeit p, den zweiten mit der Wahr- 
scheinlichkeit 1 — p. j 


Die diskrete Zufallsvariable X nehme die Werte x; (=1,2,...) mit den 
Wahrscheinlichkeiten 9; an. Für den Fall, daß die Anzahl der Sprungstellen 
endlich und gleich » ist, muß die Gleichung 


n 
Zm-l (2.3.1) 
i=1 
erfüllt sein, während, falls die Anzahl der Sprungstellen abzählbar ist, die Gleichung 
Yp=1 . (2.3.1) 
‘1 
gelten muß. 


Die Definition 2.1.3 kann man in diesem Fall folgendermaßen formulieren: 


Definition 2.3.2. Es sei z; # =1,2,...) eine beliebige Sprungstelle der 
diskreten Zufallsvariablen X. Die Wahrscheinlichkeit dafür, daß die Zufalls- 
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variable X den Wert x, annimmt, nennen wir die Wahrscheinlichkeitsfunktion 
der diskreten Zufallsvariablen X und schreiben 


PX=2)=p;, (2.3.2) 


wobei die Zahlen 9, # = 1,2, ...) die Gleichung (2.3.1) bzw. (2.3.1’) erfüllen. 

Die Wertemenge der Wahrscheinlichkeitsfunktion, die auf der Menge .der 
Sprungstellen definiert ist, kann eine beliebige endliche oder abzählbare Menge 
von positiven Zahlen sein, die nur die Bedingung (2.3.1) bzw. (2.3.1’) zu er- 
füllen brauchen; sie kann auch aus einer einzigen Zahl bestehen. Dies ist der 
Fall, wenn die Zufallsvariable X nur einen einzigen Wert und den mit der Wahr- 
scheinlichkeit 1 annimmt. 

Die Verteilungsfunktion F(x) hat hier die Form * 

Fa)=3p; (2.3.3) 
AH<E ” , 
wobei die Summation über alle diejenigen Punkte x; zu erstrecken ist, die die 
- Ungleichung x; < x erfüllen. 

Wir betrachten nun eine Zufallsvariable X, die Werte auf der x-Achse an- 
nimmt und. keine Sprungstellen besitzt. Die Verteilungsfunktion einer solchen ' 
Zufallsvariablen ist stetig. Wir werden uns hauptsächlich mit der speziellen Klasse 
der stetigen Zufallsvariablen beschäftigen. 

Definition 2.3.3. Wir nennen eine Zufallsvariable X stetig, wenn eine nicht- 
negative Funktion f(x) existiert, die für jedes reelle « die Beziehung 


Fe) = |fW)aı 2 (2.3.4) 


erfüllt, wobei F'(x) die Verteilungsfunktion der Zufallsvariablen X ist. Die Funk- 
tion f(x) nennen wir die Dichtefunktion der Zufallsvariablen X. 

Statt Dichtefunktion werden wir oft einfach Dichte sagen. 

Die Dichtefunktion f(x) genügt der Gleichung 


Foo) = | 1)de =1. (2.3.5) 


oo 


Weiter gilt für beliebige. « und b, wenn a < b ist, 
d 
PazX<b)=F(b) — F(a) =.[ f(x) de. 
[3 


Weiterhin kann man beweisen; daß für eine beliebige Borelsche Menge 8 die 
Gleichung 


P(8) = [fe) de (2.3.6) 
besteht. 2 
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Ist die Dichtefunktion f(x) im Punkt x stetig, so erhalten wir 
F'(&) = fe). (2.3.7) 
Für die Stetigkeitspunkte der Funktion f{x) gilt also 


On Ale ie 1 ea 2 


A820 A x Ac->0 A x: 


(2.3.8) 


Jede reelle, nichinegative und auf der Zahlenachse (— 00, 00) integrierbare Funk- 
tion f(x), die die Gleichung (2.3.5) erfüllt, ist Dichtefunktion einer gewissen stetigen 
Zufallsvariablen X. Die durch die Formel 


67 
Fa) = [In di 
08 
bestimmte Funktion F(x) erfüllt nämlich, wovon man sich leicht überzeugt, alle 
Bedingungen für eine Verteilungsfunktion. 
Beispiel 2.3.2. Auf der x-Achse definieren wir eine Dichtefunktion f(x) folgendermaßen: 
0 für <O0, 
x 
fi&) = „ausra2, 
0 fürz>2. 
Die Verteilungsfunktion der Zufallsvariablen X mit dieser Dichtefunktion hat die Gestalt 
oO fürr<o, 
x 
Fe) = er, 
1 für2 >2. 


B. Wir zeigen jetzt (siehe 1.3), daß daraus, daß die Wahrscheinlichkeit eines 
zufälligen Ereignisses gleich Null ist, noch nicht zu folgen braucht, daß das 
Ereignis unmöglich ist. Ebenso zeigen wir, daß daraus, daß die Wahrscheinlichkeit 
eines zufälligen Ereignisses gleich Eins ist, noch nicht das sichere Eintreffen 
des Ereignisses folgt. j 

Es sei X eine stetige Zufallsvariable mit der Wahrscheinlichkeitsdichte f(x), 
und x, sei irgendein Punkt. Wie groß ist die Wahrscheinlichkeit dafür, daß 
X =, ist? 

Aus (2.3.6) erhalten wir 


PX =x)= fie dz=0. 
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Trotzdem gehört der Punkt x, zur Menge der Elementarereignisse, die hier mit der 
x-Achse zusammenfällt. 

Wir bezeichnen mit R’ die x-Achse, aus der wir den Punkt x, entfernt haben. 
Es gilt die Gleichung 


PR) = [f@)da=1, 
# 


obwohl das Ereignis, das darin besteht, daß X einen zu ER’ gehörigen Wert an- 
nimmt, kein sicher eintretendes Ereignis ist. 

Wenn in der Verteilung der stetigen Zufallsvariablen X die Wahrscheinlichkeit 
irgendeines Ereignisses gleich Null ist, so kann man dieses Ereignis doch nicht 
als unmöglich (d.h. als unmöglich im Sinne der Definition 1.2.3) ansehen. Man 
betrachtet es als ein Ereignis, dessen Vorkommen sehr wenig wahrscheinlich ist. 
Ähnlich ist es, wenn in der Verteilung der stetigen Zufallsvariablen X die Wahr- 
scheinlichkeit irgendeines Ereignisses gleich Eins ist. Ein solches Ereignis kann 
man als sehr wahrscheinlich ansehen, nicht aber als sicher (im Sinne der Defi- 
nition 1.2.2). 


2.4, Funktionen von Zufallsvarisblen 


A. Wir betrachten folgendes Beispiel: 


Beispiel 2.4.1. Wir nehmen an, daß die Zufallsvariable X zwei Werte x, =5 und, = 10 
mit den Wahrscheinlichkeiten P(X =5) = 1/3 bzw. P(X = 10) = 2/3 annehmen kann. 
Wir transformieren X, indem wir 


Y=2X 


setzen. Dann kann Y ebenfalls zwei Werte annehmen, nämlich y, = 10 und %, = 20. Dabei 
ist 


P(Y =10)= P@X=10)=P(X=5) = 5 
P(F=2%)=PQX=2)=P(X= 10) = 5 


Die Zufallsvariable Y kann also die Werte y; = 22, («= 1,2) mit derselben Wahrschein- 
lichkeit annehmen, mit der X die Werte x, annimmt. Die Verteilungsfunktion der Zufalls- 
variablen X erhalten wir nach der Formel (2.3.3): 

0 fürzsö5, 
i 
Fa) = zune 2 <10, 


1 fürx>10. 
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Wir bezeichnen die Verteilungsfunktion der Zufallsvariablen Y mit F,(y) und erhalten 


AW= Pr <M=PeX<n=r(X< .) -:(d). 


also 
0 fürys10, 


i 
F,(y) = aa 10<ySsS20, 
1 füry >20. 


Wie wir sehen, kann man die Verteilung der Zufallsvariablen Y aus der Ver- 
teilung der Zufallsvariablen X erhalten. 

Wenn allgemein 7 =g(X) eine eindeutige und stetige!) Transformation von 
X ist, dann ist Y ebenfalls eine Zufallsvariable, deren Verteilungsfunktion man 
aus der Verteilungsfunktion von X bestimmen kann. 

Wir betrachten einige einfache Transformationen. 

Es sei F(x) die Verteilungsfunktion der Zufallsvariablen X. Wir betrachten die 
Transformation Y = — X. j 

Wir bezeichnen die Verteilungsfunktion von Y mit F,(y) und erhalten 


FW)=P(I<y=P(-X<y)=PX>—-y)=t-P(X<-y). 
(2.4.1) 
Wenn X stetig ist, dann ist 


F,Wy=1-Fi-y). (2.4.2) 
Wir schreiben die Gleichung (2.4.2) in der Gestalt 


; u) 
Fi) =1— [Ia)de, 


bezeichnen die Dichte von Y mit f,(y) und erhalten 


Fy)shW) =. (2.4.3) 
Ist.X diskret und der Punkt y eine Sprungstelle, dann erhalten wir 
FRQ)=1-F(-y—-P(X=y). (2.4.4) 


?) Es ist nicht nötig, die Funktion g(X) als stetig vorauszusetzen. Es genügt anzunehmen, 
daß g(X) eine Bairesche Funktion ist, d.h. eine eindeutige Funktion mit der Eigenschaft, 
daß die zu 9(X) inverse Funktion k(Y) ein beliebiges Intervall der Form (— 00, %) in eine 
Borelsche Menge überführt, die wir hier mit h(—oo, y) bezeichuen. Dann ist nämlich die 
Verteilungsfunktion der Zufallsvariablen Y bestimmt; denn es ist 


P(Y <y)=Pfg(X) <y) = P(Xeh(-,Y)). 


In Zukunft werden wir stets voraussetzen, daß die untersuchten Funktionen von Zufalls- 
variablen diese Eigenschaft haben. 


“wenn der Punkt 
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Wir betrachten die allgemeine lineare Transformation 
Y=aX-+b 


und unterscheiden zwei Fälle: 


I.a>0. Behalten wir die vorherigen Bezeichnungen bei, so ist 


»4d 


Fi) =PaX+5<y)=P (x < —) _F (2 = ) (2.4.5) 


Die Gleichung (2.4.5) gilt für diskrete und stetige Zufallsvariable. Im letzten 
Fall gilt außerdem 


Fa =hW = . f ö = *): (2.4.6) 


II.a < 0. In diesem Fall erhalten wir 


A=PaX+b<n=P(x>t7) -1-P(z<!7). 
[77 


a 
(2.4.7) 

Wenn X stetig ist, folgt aus der Formel (2.4.7) 

ng 
F,y)=1-F 3 (2.4.8) 
07 
/ y9® a b 

FW)=hWy) = —- —f (2.4.9) 


Die Formeln (2.4.6) und (2.4.9) kann man zu einer Formel zusammenfassen, 
nämlich 


Fy)=—f Ü — *): | (2.4.10) 


n a 


Die Formel (2.4.3) ist ein Spezialfall der Formel (2.4.10). 
Ist X diskret, so erhalten wir aus der Formel (2.4.7) 


Fay)=1-—-F 7) —P (x = a) (2.4.11) 
a 


U 


2 eine Sprungstelle der Zufallsvarisblen X ist. In den 


übrigen Punkten ist ? X= 2) =(, und die Formel (2.4.11) stimmt mit 
a 


der Formel (2.4.8) überein. 
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B. Weiter sei X eine Zufallsvariable mit der Verteilungsfunktion F(x). Wir 
betrachten die Transformation Y = X?. Die Zufallsvariable Y nimmt keine 
negativen Werte an. F|(x) sei die Verteilungsfunktion der Zufallsvariablen Y; 
‘ dann erhalten wir 


Fo 0 für y=0, 

y) = | S 

5 Pr<y)=PR<y)=P(l-Yy<X<yYy) für y>0. 
(2.4.12) 


Ist die Zufallsvariable X stetig, so ergibt sich aus (2.4.12) 
0 für ys0O, 
AW=! ;_.: = (2.4.13) 
Flyy)—-Fr(-Yy) für y>0. 


Wenn f(x) die Dichte der Zufallsvariablen X ist, dann erhalten wir die Dichte 
fı(y) der Zufallsvariablen: Y aus der Formel (2.4.13): 


l) für y=<0, 
hair) +rl-V) srl) „5 
2ys 2yy für y>V0. 
(2.4.14) 


Ist aber X diskret, dann erhalten wir aus (2.4.12) . 


fo für y=0, 
- F(-Yy)-P(X=-Yy) für y>0. 


Wenn der Punkt — Yy keine Sprungstelle der Zufallsvariablen X ist, dann ist 
P(X = - Yy) =0, und (2.4.15) stimmt mit (2.4.13) überein. 

Es seien %,,%g, ... die Sprungstellen der Zufallsvariablen X und %,,%» --. 
die ihnen auf Grund der Beziehung y; = x? entsprechenden Punkte. Dann ist 


FF) = (2.4.15) 


P(Y=y)=P(X=y)=P{X es Yy) +P(X=Yy). (2.4.16) 


‚Beispiel 2.4.2. Wir nehmen an, daß die Zufallsvariable X nur zwei Werte annehmen kann, 
nämlich = —1 und ,»=1; dabei sei P(X )=P(X=1)=1/2. Wir setzen 
Y= X? Die Zufallsvariable Y kann dann nur einen Wert annehmen, und es ist 


PrY-PR=--DIPRY- 54 Z =. 


C. Es sei X eine stetige Zufallsvariable mit der Dichte f(x). Wir betrachten die 
eineindeutige Transformation, die durch eine stetig differenzierbare Funktion 
y = g(x) gegeben wird. 


“ 
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Es sei g’(«)==0 in dem Intervall [x,,%,) und y, = g(&), % = 9(&,). Mit 
x = h(y) bezeichnen wir die Umkehrfunktion von g(x). Auf Grund der Vor- 
aussetzung ist die Funktion A(y) eindeutig, und ihre Ableitung h’(y) ist im 
Intervall [Y,, 45) endlich und stetig. Wir erhalten 


%r Ya 
Pa, <X <2)= [Fe)de = [ Mhly)]h y)ay. (2.4.17) 


E23 Y 


Ist die Ableitung h’(y) positiv, so folgt y, < Ys. Das Integral auf der rechten 
Seite von (2.4.17) gibt dann die Wahrscheinlichkeit P(y, < Y <y,) an, wobei 
Y=g(X); ist aber h’(y) < 0, so folgt y, < %,, und Formel (2.4.17) ergibt 


: Yı 
Pin <X <m) = — [Flhly]h W)dy 
Ya \ 


Yı j 
= [IR Wldy=Pa<Y<y): (2.4.18) 


Ya 


Aus (2.4.17) und (2.4.18) folgt, daß die Zufallsvariable Y = g(X) die Wahr- 
scheinlichkeitsdichte 


MR )| (2.4.19) 
hat. Die Formel (2.4.10) ist ein Spezialfall von (2.4.19). 


2.5. Mehrdimensionaie Zufallsvariable 


A. Das nachstehende Beispiel soll den Begriff einer melirdimensionalen Zufalls- 
variablen erläutern. 


Beispiel 2.5.1. Die Tabelle 2.5.1 enthält Angaben über die Zusammensetzung der Bevöl- 
kerung Polens in Hinsicht auf Geschlecht und Alter. Die Angaben stammen aus der allgemeinen 
Volkszählung vom Jahre 1931. Jeder Einwohner Polens ist in der Tafel nach zwei Kennzeichen 
eingeordnet, nach seinem Geschlecht und seinem Lebensalter. Diesen zwei Kennzeichen kann 
man Zahlenwerte zuordnen. Bei der Bearbeitung der Ergebnisse der Volkszählung fertigt man 
auf besonderen Maschinen (Perforiermaschinen) für jede von der Zählung erfaßte Person eine 
Lochkarte an. Auf diesen Karten ordnet man den untersuchten Kennzeichen gewisse Zahlen 
zu. So gibt man z. B. Männern gewöhnlich die Zahl Eins und Frauen die Zahl Null. Ähnlich 
erhält jede Altersgruppe eine bestimmte Zahl. 

In jeder Karte sind also zwei Zahlen gelocht, die einer bestimmten Altersgruppe und einem 
bestimmten Geschlecht entsprechen. Betrachten wir das Herausgreifen einer solchen Karte, 
d.h. die Zugehörigkeit einer Person zu einer bestimmten Alters- und Geschlechtsgruppe, als 
Elementarereignis, so ist jedem Elementarereignis ein Zahlenpaar zugeordnet. Hierbei handelt 
es sich um eine sogenannte zweidimensionale Zufallsvariable. 
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Wir betrachten die Menge E der Elementarereignisse. Auf dem, Borelschen 
Mengenkörper Z, welcher aus Teilmengen A der Menge # der Elementar- 
- ereignisse gebildet ist, sei die Wahrscheinlichkeit P(A) gegeben. Wir definieren 
auf der Menge E ein System von n reellen eindeutigen Funktionen, die jedem _ 


Tabelle 2.5.1.*) Die Bevölkerung Polens, angeordnet nach Geschlecht und Alter. Als 
Grundlage diente die Volkszählung aus dem Jahre 1931 


Alters- Männer Frauen 
gruppe (in 1000) (in 1000) 
0—4 2020 1962 
5—9 2005 1962 
10—14 1405 1372 
15—19 1474 1562 
20—29 2931 3213 
30—39 1999 2255 
40—49 1391 1596 
50—59 1052 1201 
60—69 753 875 
70 und älter 386 4714 
Gesamtzahl 15416 16472 


*) Quelle: Maly Rocznik Statystyczny 1939, dzial II, tablica 11. 


Elementarereignis ein System von n Zahlen x,, %,, ..., %, zuordnen. Mit anderen 
Worten, wir ordnen jedera Elementarereignis der Menge E einen Punkt im n- 
dimensionalen euklidischen Raum zu. 


Definition 2.5.1. Wir nennen ein System von n reellen und eindeutigen 
Funktionen (X, X2 --.,X,), die auf der Menge HE definiert sind, eine n-dimen- 
sionale Zufallsvariable, wenn das Urbild A eines jeden n-dimensionalen Intervallst) 
I der Form (—,..., —00;@,, ...,@,) ein zufälliges Ereignis ist. 

Für jedes Intervall I definieren wir die Wahrscheinlichkeit?) P(*(T) dafür, 
daß die n-dimensionale Zufallsvariable einen Wert annimmt, der zum Intervall 
I gehört, indem wir P®(T) = P(A) setzen, wenn A das Urbild von I ist. 

Ähnlich wie in 2.1 kann man zeigen, daß dadurch die Wahrscheinlichkeit P(® (8) 
dafür erklärt ist, daß die Zufallsvariable (X,, X, ..., X,) Werte (8, &3, ..., &) 
aus einer beliebigen Borelschen Menge 8 des n-dimensionalen euklidischen 
Raumes annimmt, d.h., daß die Wahrscheinlichkeitsverteilung der Zufalls- 
variablen (X,, X,, --., X,) dadurch bestimmt ist. 


1) Unter einem r-dimensionalen Intervall / im »-dimensionalen euklidischen Raum ver- 
stehen wir die Menge derjenigen Punkte, die die Eigenschaft haben, daß ihre ö-ten Koordinaten 
@=1,2,...,%) in einem gewöhnlichen Intervall a; <z; <b, enthalten sind. Unter dem 
Intervall (—- 00, ..., — 0%; Q,, ...,a,) verstehen wir also die Punktmenge im n-dimensionalen 
euklidischen Raum, für die die Ungleichungen -o <<, <a,(i=1,2,...,n») gelten. 

2) Vgl. den Schluß von 2.1. 
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Die Funktion P®($) wird wieder Wahrscheinlichkeitsfunktion genannt. 
Statt mehrdimensionale Zufallsvariable sagt man auch Zufallsvektor. 


B. Wir werden uns in den weiteren Darlegungen meistens auf zweidimensionale 
Zufallsvariable beschränken. 


Definition 2.5.2. Die reelle Funktion F (x, y), die durch 
Faüy)=PX<x,Y<y) 1 (2.5.1) 


definiert wird, nennen wir die Verteilungsfunktion der zweidimensionalen Zufalls- 
variablen (X, Y). 

Wie in 2.2 kann man zeigen, daß die Verteilungsfunktion F(x,y) in jedem 
der Argumente x und y eine nichtfallende und wenigstens linksseitig stetige 
Funktion ist und daß sie die folgenden Bedingungen erfüllt: 


F(-9,y) =F(i&, —a)=0, F(io,o)=1. (2.5.2) 
Wir bemerken, daß auch die folgende Gleichung erfüllt ist: 


Pa sX<m,ysY<y)=P(X<2,Y<y)—P(X<a,Y<y) 
PR <2,T7<y)+ PX <a,’ <y) 
= Fix, Y) — F(ay Yyı) — Fa, Yo) + Fan Yı)- 
(2.5.3) 


In Abb. 2.5.1 ist die Formel (2.5.3) erläutert. 


‘ Dafür, daß eine reelle Funktion F(x,y) die Verteilungsfunktion einer zwei- 
dimensionalen Zufallsvariablen ist, ist es nicht hinreichend, daß die Funktion 


Abb. 2.5.1 


1. nichtfallend und linksseitig stetig in jeder Zufallsvariablen ist und daß sie 2. 
die Bedingungen (2.5.2) erfüllt. 
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Es muß außerdem, wie man aus (2.5.3) erkennt, für alle Paare x,, x, mit 2,>x, 
und %,, y, mit y, > y, die Bedingung 


F(&, Ya) — Fi: Y) — Fi yı) + Fa, yı) = 0 


erfüllt sein. i 
Wie das folgende Beispiel zeigt, sind die beiden zuerst angegebenen Bedingungen 
nicht hinreichend: ° 
Es sei . 
0 für + ys6, 


Fia,y) = s 
I für +y>06. 


Die Funktion F(x, y) nimmt also den Wert 0 in den Punkten auf und unterhalb 
der Geraden y= —x an, während sie den Wert 1 in den Punkten oberhalb 
dieser Geraden annimmt. Die so definierte Funktion F (x, y) ist nichtfallend und 
linksseitig stetig in jeder Zufallsvariablen x und y und erfüllt die Bedingungen 
(2.5.2). Dennoch ist F(x, y) keine Verteilungsfunktion einer Wahrscheinlichkeits- 
verteilung. 

Betrachten wir nämlich irgendein Rechteck in der x, y-Ebene, von dem drei - 
Ecken oberhalb und eine Ecke unterhalb der Geraden y = — x liegen, zum 
Beispiel das Rechteck mit den Ecken (3, 3), (3, —1), (—1,83), (—1, —!i). Wenn 
wir die Formel (2.5.3) anwenden, erhalten wir i 


PI-1SX<3, -1<Y<3)=Fß,3)— FB, —1)— P(-1,3) + F(—1,—1) 
=, 


Das ist jedoch unmöglich, da eine Wahrscheinlichkeit nicht negativ sein kann. 
Es gilt der folgende Satz: 


Satz 2.5.1. Eine reelle eindeutige Funktion F (x, y) ist genau dann Verteilungs- 
funktion einer zweidimensionalen Zufallsvariablen, wenn sie 


1. in jedem der Argumente x und y nichtfallend und wenigstens linksseitig stetig ist, 
2. die Bedingungen (2.5.2) erfüllt, 
3. für beliebige Punkte (z,, Yı), (&2, Ya), wobei x, < %,, Yı < Ya ist, der Ungleichung 
Fa, %) — Fa, yı) — Fa, y) + Fa, y)Z0 
genügt. 


' €. Wir wollen nun mehrdimensionale diskrete und stetige Zufallsvariable be- 
trachten. 


Definition 2.5.3. Die zweidimensionale Zufallsvariable (X, Y) ist diskret, 
wenn sie mit der Wahrscheinlichkeit 1 Wertepaare annimmt, die zu einer gewissen 
höchstens abzählbaren Menge S von Paaren gehören, wobei jedes Paar (x,, y;) 
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eine positive Wahrscheinlichkeit 9;, besitzt. Diese Wertepaare nennen wir 
Sprungstellen und ihre Wahrscheinlichkeit Sprunghöhe. 

Die Indizes i und %k durchlaufen gewisse Mengen von ganzen Zahlen; dabei 
braucht aber die Wertemenge von % nicht für alle Indizes i die gleiche zu sein, 
wie auch die Wertemenge von i nicht für alle Indizes k die gleiche zu sein 
braucht. 


Aus dem zugrunde gelegten Axiomensystem folgt die Gleichung 
EYpa =1. | (2.5.4) 
© 

Die Verteilungsfunktion F (x, y) hat hier die Form 


Fay)=2 Pi; (2.5.5) 
U<e x 
Ur<Y 
dabei ist die Summation über alle Punkte (x,, y,) zu erstrecken, die die Un- 
gleichungen x; < x und y, < y erfüllen. 
Die Definition der Wahrscheinlichkeitsfunktion kann man in diesem Fall 
auf die folgende Form bringen: 


Definition 2.5.4. Es sei (%,y4) @=1,2,..;k=1,2,...) eine beliebige 
Sprungstelle der diskreten Zufallsvariablen (X, Y). Die Wahrscheinlichkeit, daß 
die Zufallsvariable (X, Y) das Wertepaar (&,, y,) annimmt, nennen wir Wahr- 
scheinlichkeitsfunktion der Zufallsvariablen (X, Y) und schreiben 


PX =2,Y=y)=M. (2.5.6) 


Jetzt wollen wir den Begriff einer stetigen zweidimensionalen Zufalisvariablen 
definieren. 


Definition 2.5.5. Die zweidimensionale Zufallsvariable (X, Y) heißt sielig, 
wenn es eine nichtnegative Funktion /(z, y) gibt, die für jedes reelle Zahlenpaar 
(x, y) die Beziehung 


T Y 


Fay)=/[ [to y)dyda (2.5.7) 


erfüllt; dabei ist F’(x, y) die Verteilungsfunktion der Zufallsvariablen (X,T). 
Die Funktion f(x, y) nennt man Dichtefunktion. 
Die Dichtefunktion f(x, y) genügt der Beziehung 


F(, ©) = [ f ie, y)dedy=1. (2.5.8) 


90 0% 
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Ist die Dichtefunktion f(x, y) im Punkt (x, y) stetig, dann gilt die Beziehung 


RFla,y) _ 
ET f@, y). 2) 


Also erhalten wir für einen Stetigkeitspunkt von f(x, y) 


< < 
fa, y) im Fez&<atdaystY<yti) . 9510) 
AO Ax Ay 
Ay>0 


Alle in diesem Paragraphen eingeführten Begriffe für zweidimensionale Zufalls- 
variable kann man leicht auf n-dimensionale (n > 3) Zufallsvariable verallgemei- 
nern. Insbesondere ist die Verteilungsfunktion einer r-dimensionalen Zufalls- 
variablen (X,, X, ...., X,) durch die folgende Formel definiert: 


Fix, 8%, ..,%) = P(Xı <a, X, <a... In < En). (2.5.11) 


Die Verallgemeinerung von (2.5.3) auf den Fall der n-dimensionalen Zufalls- 
vektoren (X,, Xg -..; Ä,) ist die Formel 


Ps, <u th... EX, <um + in) 
= Fa, + hr ...,%n + Rn) (2.5.12) 


n F 
= Fa + hı; il + hi, %, Kar + hu “5 %n + hn) 
i=1 


+ N Flaı + Ayers Kin ee Ye in + Rn) + 
1j=1 
i<j 


+ (1 Fl, ---, &n)> 


wobei, >06 =1,2,...,n) gilt. 

Der Satz 2.5.1 läßt sich ebenfalls auf n-dimensionale Zufallsvarisble ver- 
allgemeinern. Anstelle der Ungleichung (2.5.4) hätten wir dann die Ungleichung, 
der zufolge die rechte Seite von (2.5.12) nicht negativ ist. 

Da die Verteilungsfunktion F(&,, ..., %,) linksseitig stetig und bezüglich einer 
jeden unabhängigen Variablen nicht fallend ist, folgt hieraus, daß die Werte von 
F(&,, ...,%,) an ihren Stetigkeitsstellen die Funktion vollständig bestimmen. 


Wir wollen noch einen wesentlichen Unterschied zwischen der eindimensionalen 
und den mehrdimensionalen Verteilungsfunktionen hervorheben, und zwar: 
Besitzt eine eindimensionale Zufallsvariable X keine Sprungstellen, so ist ihre 
Verteilungsfunktion F(x) überall stetig. Demgegenüber kann die Verteilungs- 
funktion F(x,,..., 2.) Unstetigkeitsstellen besitzen, obwohl die Zufallsvariable 
(X, ..., X,) keine Sprungstellen aufweist. Dies ist dann der Fall, wenn eine 


5 Fisz 
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durch die Gleichungen X, =, ..., X, = a, definierte Hyperebene (hierbei gilt 
1z£r<n;a,...,a, sind Konstanten) derart existiert, daß 


P(X, =a,..,X,=@)>0 
gilt. 
Beispiel 2.5.2. Wir betrachten einen Zufallsvektor (X, n mit einer Verteilungsfunktion 
F(x,y) der Form 
f 0 inden Gebieten (-o<&<0, -—oo<y<o) 
und(<2z<o, -o<y=sO0), 


4\. 
ayim Gebiet (U Sr St 0s1s5), 


F(x,y) = : 
5 im Gebiet (01s+51,,57< =); 


y im Gebiet 1<xz<w, 0<sy<sI1), 


1 im Gebiet @ >1, y>1). 


} 
Der Zufallsvektor (X,Y) fällt mit der Wahrscheinlichkeit 27 in einen. Punkt von @=1, 
1 1 

3 sys1). Offenbar ist jeder Punkt mit den Koordinaten (1,4) mit 2 <y<m ein Un- 


stetigkeitspunkt der Verteilungsfunktion F(x,y), obwohl der Zufallsvektor (Y, X) keine 
Sprungstellen besitzt. 


Wenn alle „Eckpunkte“ des durch die Ungleichungen 
u SI, << +, RBSIL,<mth, .., m EI, <m + 


gegebenen verallgemeinerten Intervalls Stetigkeitspunkte der Verteilungs- 
funktion F(&,, ..., x.) sind, gilt für die „Oberfläche“ $ des Intervalls 


PiX,Xy.., K)€E8]=0. (2.5.13) 


# 

Definition 2.5.6. Em Intervall im verallgemeinerten oder üblichen Sinne ' 
heißt Stetigkeitsintervall, wenn für dieses die Bedingung (2.5.13) erfüllt ist. 

Es sei darauf hingewiesen; daß ein Intervall durchaus ein Stetigkeitsintervall 
sein kann, obwohl die Verteilungsfunktion in einigen „Eckpunkten‘ dieses 
Intervalls unstetig. sein kann. So ist im Beispiel 2.5.2 das Rechteck mit den 
Eckpunkten (1,2), (1,3), (2,2) und (2,3) ein Stetigkeitsintervall im Sinne der 
Definition 2.5.6, obwohl die Eckpunkte (1,2) und (1,3) en der 
Verteilungsfunktion F (x, y) sind. 

Ferner sei bemerkt, daß das verallgemeinerte Intervall der Form (—o0, — oo, 
..., 090,4, 4 ..., 4) dann und nur dann ein Stetigkeitsintervall ist, wenn der 
Punkt (a, 09, .. Ha ein Stetigkeitspunkt der Verteilungsfunktion ist. 
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2.6. Randverteilungen 


Es sei (X, Y) eine diskrete Zufallsvariable, die die Werte (z,, y,) annimmt. 
Wir schreiben folgendermaßen: i 


PX =2,Y=y) = Pi, 
Pr = 2 Pir; (2.6.1) 
t : = 
. = D pie: R (2.6.2) 
k : 
Dann ist 


Pr=3p=PX =, Y=y) +4 PX=2,Y=y) 
7 


+P&X=a,Y=-y)+t; 


also ist ?., die Wahrscheinlichkeit dafür, daß Y = y, ist, wenn X irgendeinen 
der möglichen Werte annimmt. Deshalb kann man 


? = P(Y =y) 
schreiben. Offensichtlich ist ferner 
EP = 3 20 —1.- 
5 ik 


Die Zahlen »., stellen also die Wertemengen einer Wahrscheinlichkeitsfunktion 
dar. Die durch diese Wahrscheinlichkeitsfunktion bestimmte Verteilung nennen 


wir Randverteilung der Zufallsvariablen Y in der zweidimensionalen Verteilung. 


der Variablen (X, Y). Ebenso bilden die Zahlen 7,. die Wertemenge der Rand- 
wahrscheinlichkeitsfunktion, der Zufallsvariablen X in der zweidimensionalen 
Verteilung der Variablen (X, Y). 


Beispiel 2.6.1. In einer Umme befinden sich 21 Papierstreifen. Jeder Streifen ist mit einer 


der natürlichen Zahlen 1,2,...,21 versehen, wobei jede dieser Zahlen nur einmal auftritt. 
Uns interessieren zwei Merkmale dieser Zahlen: die Teilbarkeit durch 2 und durch 3. Wir ziehen 
einen Streifen. Dem Auftreten einer geraden “Zahl ordnen wir die Zahl Eins zu, dem Auftreten. 
einer ungeraden Zahl die Zahl Null und bezeichnen diese Zufallsvariable mit X. Die Variable X 
nimmt also die beiden Werte x, = 1 und x, = 0 an. Ebenso nehme die Variable Y den Wert 
%, = { beim Auftreten einer durch 3 teilbaren Zahl und den Wert 4, = 0 beim Auftreten 
einer nicht durch 3 teilbaren Zahl an. ; 


Unter den 21 Zahlen gibt es 


3 Zahlen, die durch 2 und durch 3 teilbar sind, 
7 Zahlen, die durch 2, aber nicht durch 3 teilbar sind, 
4 Zahlen, die nicht durch 2, aber durch 3 teilbar sind, 
u; Zahlen, die nicht durch 2 und nicht durch 3 teilbar sind. 


5* 
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‚Setzen wir voraus, daß die Wahrscheinlichkeit,. gezogen zu werden, für alle Streifen dieselbe 
ist, so erhalten wir 


4 
j -PX=-0,7Y-)=-—, 
Paı ( ) >1 


3 
Pıı ( ) 31 


7 7 
=PX=1,7=-0)=—, =PX=0,7Y=-0)=—. 
Pı2 ( ) 231 P22 ( ) 21 


Wir können zwei Randverteilungen betrachten: eine, wenn wir die Zahlen ausschließlich 
nach ihrer Teilbarkeit durch 2, die andere, wenn wir sie ausschließlich nach ihrer Teilbarkeit 


durch 3 klassifizieren. 
Die Gleichung (2.6.1) liefert 


j r 3 1 4 _ T ; 
P1=Pı Pa= ii ı’ 
4 = 7 # 7 14 

P.2 = Pı2 T Pa 3 1 3 


Das ist die Randverteilung bezüglich der Teilbarkeit durch 3. Ebenso erhalten wir aus 
(2.6.2) 


ex + _ 3 e 7 10 
Pr = Pı T Pa 31 1 a 
1 4 + ”_ 11 

Pa. = Paı Pa a1 ı° 


Das ist die Randverteilung bezüglich der Teilbarkeit durch 2. 
Die Bezeichnung Randverteilung wird verständlich, wenn wir dieses Beispiel in Form der 
Tabelle 2.6.1 anordnen. ; 


Tabelle 2.6.1. Die Anzahl der Zahlen in den einzelnen Gruppen 


durch 2 teilbare durch 2 nicht 


Zahlen teilbare Zahlen insgesamt 
durch 3 teilbare Zahlen 3 4 7 
durch 3 nicht teilbare Zahlen 7 7 14 
insgesamt 10 11 21 


Wie wir sehen, erhalten wir in der untersten Zeile der Tabelle 2.6.1 die Verteilung hinsicht- 
lich der Teilbarkeit durch 2 und in der rechten Außenspalte die Verteilung hinsichtlich der 
Teilbarkeit durch 3. 


Es sei allgemein F (x, y) die Verteilungsfunktion der zweidimensionalen Zufalls- 
variablen (X, Y). Die Verteilungsfunktion der Randverteilung von X hat die 
Form 


F(«,o) =P(X<z,Y<o). (2.6.3) 


2.7. Bedingte Verteilungen 69 


Wenn (X, Y) eine diskrete Zufallsvariable ist, dann nimmt (2.6.3) die Gestalt 
F(z, 00) = S NP (2.6.4) 
USE Ur 
an, wobei die Summation über alle k und über diejenigen ö i zu erstrecken ist, für 
die .die Ungleichung x; < x erfüllt ist. 
Ist (X, Y) eine stetige Zufallsvariable, so erhalten wir 


F(x, ©) = fi ft fix, y) dy de. | (2.6.5) 


= 00 


In der zweidimensionalen Verteilung von (X, Y) er die Dichte ar Rand- 
verteilung von X die Gestalt 


= [He nay. | (2.6.6) 


0 
Ähnliche Formeln kann man für die Randverteilung der Zufallsvariablen Y 
erhalten. 
Es sei F(x,,%, ...,%,) die Verteilungsfunktion des Vektors (X, X, ...,X,) 


für na>2. Man kann dann : k-dimensionale Randverteilungen erhalten 


(k=1,2,...„2 — 1). So hat zum Beispiel die Randverteilungsfunktion der 
Zufallsvariablen (X,, X,) die Form 


Fix, 2, %©,...,0)=P(X, <a2,X,<%, X, <o®, ..., X, <<). 


2.7. Bedingte Verteilungen 


A. In 1.5 haben wir die bedingte Wahrscheinlichkeit P(A|B) definiert; das war 
die Wahrscheinlichkeit des Ereignisses A unter der Bedingung B. Wir wollen 
uns nun mit den bedingten Verteilungen beschäftigen. 

Es sei (X,Y) eine zweidimensionale Zufallsvariable, wobei X die Werte 
&;(@=1,2,...)und Y die Werte y,(k=1,2,...) annehmen kann. Es sei weiter 


PX =«, Y = Ye) = Pin- 


Die Randverteilungen sind dann 
PX=2)=». = pw, 
PY=yw)=-P.“ = I Pi. 
Für jedes und jedes % definieren wir die Wahrscheinlichkeiten 


Pe. Ye) (2.7.1) 
P.k 
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und 


PY=uXK-m)=5 (2.7.2) 


ie 


Bei festem y, und veränderlichem, alle möglichen Sprungstellen durchlaufendem 
x; stellt der Ausdruck (2.7.1) die bedingte Wahrscheinlichkeitsfunktion der diskreten 
Zufallsvariablen X unter der Bedingung Y = y, dar. Bei festem x; und veränder- 
lichem, alle möglichen Sprungstellen durchlaufendem 3; stellt der Ausdruck (2.7.2) 
die bedingte Wahrscheinlichkeitsfunktion der diskreten Zufallsvariablen Y unter der 
Bedingung X =x; dar. 

In der Tat sind die Ausdrücke auf den rechten Seiten der Gleichungen (2.7.1) 
und (2.7.2) nichtnegative Zahlen und höchstens gleich Eins. Außerdem bestehen, 
wie man leicht nachprüft, die Gleichungen 


Zi Pi p 
PX=2/ =y) = —-—- -<Z=1, 
2 2 P-% Pr 
Pr p 
YPY=y|X =x) = +— aueeen eg 
k pi: P: 


B. Es sei f(x, 4) die Dichte einer zweidimensionalen stetigen Zufallsvariablen 
(X, Y). Wir betrachten das Intervall [x,« + k) und das Ereignis z< X <x +,h; 
dabei sei 


PasX<zxz+h)>0. 
Für jeden Wert y und für jedes Intervall [e, x + h] definieren wir die bedingte 
Wahrscheinlichkeit 
PY<yasX<e+h) 
Pa<sX<x+h) 


th 
f re, y)dyda 
wer, (2.7.3) 


4b oo 


[ Ste» )dydz 


= 0 


P(Y<yla<sX<ı+th= 


Der Ausdruck (2.7.3) ist die bedingte Verteilungsfunktion der Zufallsvariablen Y 
unter der Bedingung, daß die Zufallsvariable X die Ungleichung z<X <x-+h 
erfüllt; dabei wird Pr sX <x+h)> 0 vorausgesetzt. Der Ausdruck auf der 
rechten Seite der Formel (2.7.3) ist nämlich bei festem x und h eine stetige und _ 
nichtfallende Funktion von y, die die Werte 0 für y=— oo undl für y= oo 

annimmt. Schwierigkeiten treten auf, wenn wir die bedingte Wahrscheinlichkeit 
P(Y <y|X =x) angeben wollen, da in diesem Fall PX =x)=0 ist. Wir 
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beschränken uns hier auf den Fall, daß der Grenzwert des Ausdrucks (2.7.3) 
- für h—0 existiert. (Vgl. 3.6.C und den Anhang.) 
Wir nehmen an, daß die Dichtefunktion f(x, y) überall stetig und die Randdichte- 


funktion 
oo 


ha) = [ Hay) dy (2.7.4) 


0 


eine stetige Funktion von « ist; außerdem sei f} (2) im betrachteten Punkt x positiv. 
Teilt man Zähler und Nenner des Ausdrucks auf der rechten Seite der Formel 
(2.7.3) durch A und geht dann mit A—0 zur Grenze über, so erhält man die 


Beziehung ; 


| [tes)ay 
F(yla)=imP(Y<ylea<X<x-+h)= a —., (2.7.5) 
R>0 fhı(®) 


Der Ausdruck (2.7.5) ist für feste x-Werte die bedingte Verteilungsfunktion der 
Zufallsvariablen Y. Aus unseren Voraussetzungen folgt, daß sie eine Verteilungs- . 
funktion einer stetigen Zufallsvariablen ist. 

Ihre Dichtefunktion, die wir mit f(y|x) bezeichnen wollen, wird durch die For- 
mel 


le) = ie). (2.7.6) 
I.) 
gegeben. 
Ebenso kann man die Verteilungsfunktion und die Dichtefunktion der bedingten 
Verteilung der Zufallsvariablen X unter der Bedingung Y =y bestimmen. 
Wir wollen (2.7.5) in der Gestalt 


y 
ha) F(ylo) = [Hay dy 

schreiben. Daraus erhalten wir die Formel 
Jharwla)de = F,(y), (2.77) 


die eine Verallgemeinerung des Satzes 1.6.1. über die totale Wahrscheinlichkeit 
für stetige Zufallsvariable ist. 

Wenn wir Zufallsvariable ‚untersuchen, deren Dimension größer als 2 ist, 
können wir bedingte Verteilungen unter der Bedingung betrachten, daß eine 
gewisse Gruppe von Zufallsvariablen feste Werte annimmt. Als Beispiel wollen 
wir die dreidimensionale stetige Zufallsvariable (X ,X,X,) betrachten, deren 
Dichtefunktion f(&,,%,2;) überall stetig und deren sämtliche Randdichtefunk- 
tionen stetig seien. In diesem Fall erhalten wir z. B. die folgenden bedingten Ver- 
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teilungsfunktionen: 


f May %3) dir 
Fiaz|a,8) = TI —, (2.7.8) 


x 


f 81% %3) dixz 


% 4 


[ [taa2) da; dx, 
F(&,23|2) = T——— — — — —  , (2.7.9) 


© 00 


f [ta,82) da,dzz 


-=X —o 


Dabei nehmen wir selbstverständlich an, daß die Nenner auf der rechten Seite 
von (2.7.8) und (2.7.9) positiv sind. Analoge Formeln erhält man für die bedingten 
Dichtefunktionen. 


Beispiel 2.7.1. Wir kehren zur Tabelle 2.6.1 zurück und wollen feststellen, wie die durch 
3 teilbaren und durch 3 nichtteilbaren geraden Zahlen verteilt sind. Anders ausgedrückt 
fragen wir: Wie groß ist die Wahrscheinlichkeit, daß wir, wenn wir aufs Geratewohl ziehen, 
eine durch 3 teilbare Zahl erhalten, wenn wir schon vorher wissen, daß die Zahl gerade ist? 
Bei dieser Formulierung des Problems interessiert uns nicht die Verteilung aller 21 Zahlen, 
sondern nur die Verteilung eines gewissen Teiles, nämlich die Verteilung der 10 geraden 
Zahlen hinsichtlich ihrer Teilbarkeit durch 3. 

Benutzen wir die Bezeichnungen aus Beispiel 2.6.1, so erhalten wir auf Grund von (2.7.2) 


Prey Tan, 
ran PX=1) pm. 10 
P(Y=0,X=1 7 
Brain N) et 
PX=1 m. © 


Analog ’erhält man die bedingte Verteilung der ungeraden Zahlen in durch 3 teilbare und durch 
3 nichtteilbare: 


en 
PY=1X=0 4 
Brei N ma 
PX=0) 7. 1 


Ebenso kann man die. bedingten Verteilungen der durch 3 teilbaren sowie der durch 3 
nichtteilbaren Zahlen in gerade und ungerade bestimmen. 


€. Einen Spezialfall der bedingten Verteilung einer Zufallsvariablen X stellt die 
sogenannte gestutzte Verteilung von X dar. 

Definition 2.7.1. Es sei X eine Zufallsvariable und 8 eine Borelsche Menge auf 
der x-Achse mit der Eigenschaft, daß 0<P(Xe8)<1 gilt. Die für jedes 
reelle x durch den Ausdruck P(X <x|X € 8) definierte bedingte Wahrschein- 
lichkeit nennen wir die gestutzte Verteilung der Zufallsvariablen X. 
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Ist X eine diskrete Zufallsvariable mit den Sprungstellen x; und den Sprung- 
höhen 7,, dann hat die Wahrscheinlichkeitsfunktion der gestutzten Verteilung von 
X die Form 

Pi 


für € S, 
Pr=areg 2A nKe9  ) 2H 
P(Xe 8) s 
0 für x; & Ss. 
Ist X eine stetige Zufallsvariable mit der Dichte /(x), so gilt 
= fie) de 
PX <alXeg- TÄSBZEN _ -eians 
P(XeE8) ‚ t@) de 
Br 


Die Dichte g(x) dieser Verteilung nimmt die folgende Form an: 
EL für ze S 3 
x) de 
= Te 
1) fürzdS. 
Beispiel 2.7.2. Wir betrachten die Zufallsvariable X mit der Dichte 


1für0oszs1V, 
fa) = . 
Ofürz<0, z>1. 


Für die Menge $ wählen das Intervall ß 3) ; dann gilt 
1/2 1 
P(XeES) z de = r% 
Die Dichte g(x) der gestutzten Verteilung der Zufallsvariablen X hat die Form 


’ 


2für0<as 


v|- 


gr) = N 
für <0,2> E% 


2,8. Unabhängige Zuiallsvariable 


A. In 1.7 haben wir den Begriff der Unabhängigkeit von zufälligen Ereignissen 
definiert. Wir übertragen diesen Begriff jetzt auf Zufallsvariable. 

Mit F(x,y),F,l&) und F,(y) seien entsprechend die Verteilungsfunktionen der 
zweidimensionalen Zufallsvariablen (X,Y) und die Randverteilungsfunktionen der 
Zufallsvariablen X und Y bezeichnet. 
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Definition 2.8.1. Die Zufallsvariablen X und Y sind unabhängig, wenn für 
beliebige reelle Zahlenpaare (x,y) die Gleichung 


Fia@y) = Fı@)F:(y) (2.8.1) 
gilt. 
Es seien jetzt (a,b) und (c, d) mit a <cundd <d beliebige Punkte der x,y- 
Ebene. Es ist 


PasX<ce)=F,()- F,(a), 
Pb<Y<d) = R,(d) — F,b). 


Multiplizieren wir die Seiten dieser Gleichungen miteinander und wenden wir: 
die Formel (2.8.1) au, so erhalten wir 


PaszX<oPbsY<d)=F(cd) — F(cb) — F(ad) + F(a,b), 
woraus unter Berücksichtigung von (2.5.3) 


PaszX<cbs ee nV Y<d (2.8.2) 
folgt. 

Wir betrachten die zweidimensionale diskrete Zufallsvariable (x, Y) mit den 
Sprungstellen (x;,y,) und den Sprunghöhen p;,; X und Y seien unabhängig. Be- 
trachten wir die Formel (2.8.2) für den Spezialfall, daß sich die Rechtecke (a <s X 
<cb<Y<d) auf einen Punkt (X =a,Y=b) zusammenziehen, also für 
c—a und d—b, und benutzen wir den Satz 1.3.4, so erhalten wir für beliebige 
Paare (&;,y,) die Gleichung 


= PX =2,Y=y) =-PX =n)P(Y =yY) = Pi. P.r- (2.8.3) 


Man zeigt ieicht: Ist die Gleichung (2.8.3) für beliebige Zahlenpaare (&;,Yx) 
erfüllt, so ist es auch die Gleichung (2.8.1). 

Also haben wir folgendes Ergebnis erhalten: Ist (X, Y) eine diskrete Zufalls- 
variable, so ist für die Unabhängigkeit der Zufallsvariablen X und Y notwendig 
und Ruraichend, daß die Gleichung (2.8.3) für beliebige Zahlenpaare (x,,%:) 
erfüllt ist. 

Wenn wir (2.7.1) und 2. 7.2) berücksichtigen, so erhalten wir für beliebige 
Zahlenpaare (i,k) die Beziehungen 


PX=2|Y=-y)=PAX=a), 
PY=yX=»)=-P(Y=y). 


(2.8.4) 


Aus diesen Formeln folgt: Sind die Zufallsvariablen X und Y unabhängig, so 
ist die bedingte Verteilung der Zufallsvariablen X für.alle Werte von Y dieselbe; 
also gibt uns ein Wert von Y keinerlei Informationen über die Verteilung der 
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Zufallsvariablen X, und amgakehrt ist die bedingte Verteilung von Y für alle 
Werte der Zufallsvariablen X dieselbe. 

Ist die Zufallsvariable (X, Y) stetig, so erhalten wir durch Differentiation des 
Ausdrucks (2.8.1) nach x und y 


®F(z,y) 


u ey = FokW)=hahßh; (2.8.5) 
x0y j 


dabei schließen wir die Punktmenge aus, auf der die Dichtefunktion eventuell 
unstetig ist. 
Es sei umgekehrt die Gleichung (2.8.5) erfüllt. Wir erhalten dann 


Fa,y) = [ Inemazav= | nenn asas 


z % 
— [hi@)da [ Il) dy = Fl) Fx(y) 


und haben also das folgende Ergebnis bekommen: Ist (X, Y) eine stetige Zufalls- 
variable, deren Dichtefunktion f(x,y) überall stetig ist, so ist. für die Unabhängig- 
keit der Zufallsvariablen X und Y notwendig und hinreichend, daß die Gleichung 
(2.8.5) für alle (x,y) erfüllt ist. 

Es seien $, bzw. 8, beliebige Borelsche Mengen auf der x- bzw. y-Achse. Man 
kann beweisen, daß die Gleichung 


P(XE8,YES)=PIiXES)P(YES,) (2.8.6) - 


gilt, wenn die Zufallsvariablen X und Y unabhängig sind. 
Aus den Gleichungen (2.7.5) und (2.8.5) erhalten wir für jeden Wert von x 


F(yla) = F,(y) (2.8.7) 
und analog für jedes 4 
F(z|y) = F,(): (2.8.8) 


Sind die Zufallsvariablen X und Y unabhängig, so hängt die bedingte Ver- 
teilungsfunktion der Zufallsvariablen Y unter der Bedingung X = nicht von 
x ab. Dasselbe gilt für die bedingte Verteilungsfunktion der Zufallsvariablen X. 
Auf Grund der Gleichungen (2.8.7) und (2.8.8) sowie der Gleichungen (2.8.4) er- 
hält der Begriff der Unabhängigkeit eine sehr anschauliche Bedeutung. 


Beispiel 2.8.1. Wir wollen zweimalige Würfe mit einer Münze betrachten. Die Zufalls- 
variable X soll den Wert 0 bzw. 1 annehmen, wenn als Ergebnis des ersten Wurfes Zahl 
bzw. Adler erscheint, die Zufallsvariable Y die Werte 0 bzw. 1, wenn beim zweiten Wurf Zahl 
bzw. Adler erscheint. j 
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Als Ergebnis eines doppelten Wurfes kann die zweidimensionale Zufallsvariable (X, Y) 
einen der Werte 


(1,1), (1, 0), (0,1), (0, 0) 


annehmen. a 

Alle diese Ergebnisse treten mit derselben Wahrscheinlichkeit 1/4 auf. Jede der Zufallsvaria- 
blen X und Y kann einen der Werte 0 oder 1 mit der Wahrscheinlichkeit 1/2 annehmen. Wir 
erhalten also f 


PX=1,Y=1=2=3:5=PIX=UPr=N), 
PX= ‚F=)-2=-PX-DPT=0), 
PX=0,Y=1)=-2=PIX=OPIF=1), 
PX=0,Y=-0)= 2 -PX=0P(T=0) 


Die Zufallsvariablen X und Y sind also unabhängig. 


Es seien X, und X, unabhängige Zufallsvariable. Wir betrachten die eindeutigen 
Funktionen Y,=g,(X,) und Y,=g,(X,). Dann sind Y, und Y, ebenfalls 
Zufallsvariable (vgl. die Fußnote auf S. 57), und wir wollen zeigen, daß Y, und 
Y, ebenfalls unabhängig sind. 

Wir bezeichnen mit g7"(— 00, y,) und 9,"(— 00, 43) die entsprechenden Borel- 
schen Mengen, welche die Urbilder der Intervalle (— 00, y,) und (—0,%,) be- 
züglich g, und 9, sind. Dann erhalten wir 


.PH<y Y<y)= P(g,(X,) < yp 9a(X,) < %.) 
= P(X, € 9 (0, Yyı), X2 € 9, '(— 0, ya) 
= P(X,eg'(—, yı)) P(X2 € (©, %.)) 
= P(Y, <y)- P(Y,<Y). (2.8.9) 
B. Der Begriff der Unabhängigkeit läßt sich auch auf endlich oder abzählbar 
viele zufällige Zufallsvariable ausdehnen. 


Definition 2.8.2. Die Zufallsvariablen X,,X,,...., X, sind unabhängig, wenn 
für beliebige Punkte (x,,%,, ...,%,) die Gleichung 


F(&,%% ..-, 2) = Filz) Fal&)-- Fo (&n) (2.8.10) 


\ 


gilt; dabei ist F(x,% ---,%.) die Verteilungsfunktion der Zufallsvariablen 
(X,X2..,X,), und Fa) ...,n(2.) sind die Randverteilungsfunktionen 
der Zufallsvariablen X, ..., X, ; 
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Man kann die folgende Bemerkung machen: Sind die Zufallsvariablen X,, 
Xy..., X, unabhängig, dann sind auch für jedes s<r die Zufallsvariablen 
Kun; A, Sk <e-<k,sn) unabhängig. In der Tat folgt aus (2.8.10), 
wenn wir der einfacheren Schreibweise wegen k, =1,k,=2,...,k,=s setzen, 
die Gleichung 


F (&,,%9 ..., 9, ©, ..., + ©) 3 
= F(&)F,(&) Felt) Past Ro) Fn(+00) = Fıla)Frla)--Fslk). 


Nun erklären wir die Unabhängigkeit für abzählbar viele Zufallsvariable. 


Definition 2.8.3. Die Zufallsvariablen X,,X,X,, ... sind unabhängig, wenn 
für jedes n = 2,3,4,... die Zufallsvariablen X,,X,,..., X, unabhängig sind. 


C. Der Begriff der Unabhängigkeit läßt sich folgendermaßen auf Zufallsvektoren 
übertragen: 


Definition 2.8.4. Die Zufallsvektoren 
= (X, Xy...,X,), Y=(Y,Y»:-.; Yr) 
sind unabhängig, wenn für alle j-+ r reellen Zahlen 2,0 ...,%, Ya Ya +++» Yr. 
F(&,, %,...,% Yı, Br + Yr) = Ol I ...,2%;)H (Yis Y2 - > Y%r) 


gilt, wobei F, G bzw. H die Verteilungen der Zufallsvektoren (X,, X, ...,X5 
Y, I»... Ir), (X, X ...,X,) bzw. (7, Y,,..., Y,) sind. 

Es sei betont, daß aus der: Unabhängigkeit der Zufallsvektoren ge (X, 
Xy..,X;) und Y=(Y,TY,..., Y,) keineswegs folgt, daß die Komponenten 
X,Xy ..., X; des Vektors X oder die Komponenten Y,, Y, ---, Y, des Vektors 
Y unabhängig sind. 

Der Begriff der Unabhängigkeit läßt sich auch auf den Fall einer beliebigen 
endlichen oder abzählbaren Menge von Zufallsvektoren verallgemeinern. Die Defi- 
nitionen sind den Definitionen 2.8.2 und 2.8.3 analog. 
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A. Die Betrachtungen aus 2.4 lassen sich ohne Schwierigkeit auf Funktionen 
von mehrdimensionalen Zufallsvariablen übertragen. Wir wollen jetzt eine Formel 
für die zweidimensionale Dichte einer Funktion der stetigen Zufallsvariablen 
(X, Y) herleiten, die der Formel (2.4.19) entspricht, welche für eine Funktion 
einer eindimensionalen Zufallsvariablen galt. 

ER sei - 


d,=g(X, PN, D,=g(X, 7) (2.9.4) 
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eine stetige und eineindeutige Transformation der Zufallsvariablen X und Y mit 
der zweidimensionalen Dichte /(z, y). Wir wollen annehmen, daß die Funktionen 
gı und g, stetige partielle Ableitungen nach x und y besitzen. Ferner sei [a <X 
<b,c<s Y<d) ein Rechteck, auf dem die Funktionaldeterminate der Trans- 
formation (2.9.1) von Null verschieden ist. Wir bezeichnen mit x =h,(u,, us). 
und y = hz(ü,, u) die Umkehrung der Transformation (2.9.1). Nach den Vor- 
aussetzungen sind die Funktionen %, und h, ebenfalls eindeutig und haben stetige 
partielle Ableitungen nach u, und «,. Mit J bezeichnen wir die Funktionaldeter- 
minante der Umkehrung der Transformation: 


Die Funktionaldeterminante ist nach Voraussetzung endlich und stetig in dem 
Gebiet S der u,, u,-Ebene, in das das Rechteck «a <X <b,c<Y'<.d) durch 
die Transformation (2.9.1) abgebildet wird. Wir erhalten weiter 


bd 
PasX<b, e<Y<d) )=/ [te y) )dxdy 


= [ [Hr Wo), h2ln m]ITIdun din. (2.9.2) 
(8) 
Aus dieser Formel erkennen wir, daß die zweidimensionale Dichte der Variablen 
U, und D, die folgende Form hat: 


hun, u) = Th, (un, %); baum, W)] IF]. a: (2.9.3) 


B. Wir beschäftigen uns jetzt mit den Verteilungen der Summe, der Differenz, des 
Produktes und des Quotienten zweier Zufallsvariabler. Diese Ausdrücke sind Bei- 
spiele für stetige Funktionen von mehrdimensionalen Zufallsvariablen, und außer- 
dem sind sie äußerst wichtig für die Wahrscheinlichkeitsrechnung und deren An- 


wendungen. 


Beispiel 2.9.1. Wir betrachten noch einmal das Würfeln mit einem Würfelpaar. Die 
Zufallsvariable X sei die Augenzahl des ersten Würfels und die Zufallsvariable Y die Augen- 
zahl des zweiten Würfels. Jede der Veränderlichen X und Y kann die Werte 1,..., 6, jeden 
mit der Wahrscheinlichkeit 1/6 annehmen. 

Die zweidimensionale Veränderliche (X, Y) kann 36 Wertepaare (i, k) annehmen, wobei 
i und k alle Werte von 1 bis 6 durchlaufen. Wir bilden für jedes mögliche Wertepaar (t, k) die 
Summe i -+'k. Alle möglichen Werte der Summe i + k bilden die Wertemenge einer neuen 
Zufallsvariablen, welche wir als Summe der Zufallsvariablen X und Y bezeichnen. Diese 
Summe ist eine eindimensionale Zufallsvariable. Sie kann die folgenden Werte annehmen: 


2,3,4,...,11,12. 
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Wir setzen Z= X -+ Y und berechnen die Wahrscheinlichkeitsfunktion der Variablen 
Z. Wegen der Unabhängigkeit der Variablen X und Y (siehe 2.8) ist 


PIA=N=P(iX=NPIT=N= 


1 
PA=B=PX=1Y=N+PX=2Y-1)=- 
1 


PZ=Y=PX=1Y=NHPR=2Y=N)HPX=3Y-1)- 


[er 


1 
PZ=2)=PX=6,Y=-6)=—. 
( I)=P gg 


Der Leser kann sich leicht davon überzeugen, daß tatsächlich 


PZ=2)+PlZ=3)+.+PZ=-2)=1 
ist, ? 


Ebenso kann man beim Würfeln mit zwei Würteln die Zufallsvariable 7=X 
— Y betrachten (X und Y haben die gleiche Bedeutung wie vorhin). Die Werte- 
menge der Zufallsvariablen 7 ist hier die Menge aller möglichen Werte der Diffe- 
renz  — k. Die Zufallsvariable V kann die Werte 


—5, —4,...,0,1,2,...,5 


annehmen. Als Beispiel berechnen wir 


PV=)=-PX=1,Y=1)+PX=23,Y=)+PX=3,Y=3) 
+PX=4,Y7=4)+PX=5,Y=5)+P(X=6Y-6) 


u 
6 


PV=-5)=PX=1Y Dee 
36 
Wie der Leser leicht nachprüfen kann, gilt die Gleichung 


5 
3 PV=bh)=1. 
k=—5 
Ähnlich kann man die Wahrscheinlichkeitsfunktionen der Zufallsvariablen 
T=X:.YwudS= = betrachten. 


An dem obigen Beispiel erkennt man, was man unter der Summe, der Differenz, 
dem Produkt oder dem Quotienten zweier Zufalisvariabler zu verstehen hat. 
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Es ist also die Zufallsvariable X + Y eine Funktion der zweidimensionalen 
Zufallsvariablen (X, Y). Zur Wertemenge der Zufallsvariablen X + Y gehören 
alle möglichen Werte der Summe = -+-y und nur diese, wobei x ein möglicher 
Wert der Zufallsvariablen X und % ein möglicher Wert der Zufallsvariablen Y ist. 
Ebenso kann man die Zufallsvariable definieren, die gleich der Summe Sadlich 
vieler Zufallsvariabler ist. 

Die Wertemenge der Zufalisvariablen X — Y, die gleich der Differenz zweier 
Zufallsvarisbler X und Y ist, besteht aus allen möglichen Werten von = — , 
wobei x ein möglicher Wert von X und y ein möglicher Wert von Y ist. Analog 
definiert man das Produkt und den Quotienten zweier Zufallsvariabler. 


C. Es sei die Verteilung der zweidimensionalen Zufallsvariablen (X, Y) bekannt. 
Wir wollen dann die Verteilungen derjenigen Zufallsvariablen bestimmen, die wir 
als Resultat der vier arithmetischen Operationen, ausgeführt an den Zufalls- 
variablen X und Y, erhalten. 


Gesucht ist die Verteilungsfunktion der Summe 
Z=X-+Y (2.9.4) 
der Zufallsvariablen X und Y. Wir wollen also die Funktion 
Fe@)=P(X+Y<z) 


bestimmen. 


Wenn wir für einen gegebenen Wert von z in der x, y-Ebene die Gerade «+ y 
= 2 zeichnen (Abb. 2.9.1), ist F(z) die Wahrscheinlichkeit dafür, daß der Punkt 
mit den Koordinaten (x, y) unterhalb dieser Geraden liegt. 


Abb. 2.9.1 


Ist (X, Y) eine diskrete Zufallsvariable, die die Werte (x;, y,) annimmt, dann er- 
halten wir 


Fe)= % PX =2,Y=y), (2.9.5) 


HtyR<E 
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wobei die Summation über alle Werte x,, y, zu erstrecken ist, die die Ungleichung 
% + % < 2 erfüllen. 

Es sei (X, Y)) eine stetige Zufallsvariable, und f(x, y), fı (x), f2a(y) seien die Dich- 
ten der Zufallsvariablen (X, Y), X bzw. Y. Wir wollen die Gleichung (2.9.4) in der 
Form 


X=-X, Z=X+Y ode X=X, Y=Z-X (2.9.6) 


schreiben; dabei haben wir die Identität X = X mit aufgeschrieben, um dieses 
Problem auf die schon behandelte Transformation (2.9.1) zurückzuführen. Es ist 


o 1 
= =—1l und J|=1. 
1—1 
Aus (2.9.3) folgt, daß die Dichte der Zufallsvariablen (X, Z) gleich 
fiz,2 — x) . (2.9.7) 


ist. Um die Dichte y (2) der Zufallsvariablen Z zu bestimmen, integrieren wir den 
Ausdruck (2.9.7) nach x von — oo bis oo und erhalten als Randdichte der zwei- 
dimensionalen Zufallsvariablen (X, Z) 


y(e) = cs x,2 — x)de. (2.9.8) 
Schließlich erhalten wir 
Fe)=[ [a2 — @)dadz. (2.9.9). 


Wenn die Zufallsvariablen X und Y unabhängig sind, ist 
es) =h@ahW): 


also 

yv@) = I h(@)fe(e — x) de (2.9.8) 
und 

Fe) = [ [ halae — =) da da. (2.9.9) 


In den Formeln (2.9.8), (2.9.8’), (2.9.9), (2.9.9) kann man wegen der Symmetrie 
der Summe x durch 2 — y und 2— x durch y ersetzen. 


Beispiel 2.9.2. Die Zufallsvariable X habe die Dichte 
x 


fa) = ER, (2.9.10) 


Ver 


6 Fisz 
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Fo 
Statt des Ausdrucks e 2 schreibt man auch 


(3°) 
exp an . 


In FicHtzxHozz [1], S. 633, oder SmIRnow [1], S. 219-223, findet der Leser einen Beweis 
für die Beziehung. 


Der Ausdruck (2.9.10) ist die Dichte der Gaußschen Verteilung oder auch Normalverteilung. 
‘‘ Wir werden sie später im einzelnen untersuchen. 
Die Zufallsvariable Y habe die Dichte 


\ 


1 
I) = Ve“ 


Wir nehmen an, daß X und Y unabhängig sind; die Dichte von (X, Y) ist also gleich 


y* 
® 


1 y® 1 _ at 
2 = -—e 2, (2.9.11) 


Wir betrachten die Zufailsvariable 
Z=X-+HY. 


Nach Formel (2.9.8°) ist die Dichte der Zufallsvariablen Z 


(@) f . e il ex | e= 2) ” 
2) = —a EX — I ——— _— 4 
i IK | 2) jer Aue 


oo 
1 2% — 2227 +22 
= — exp |— -———— | dr. 
27 2 
oo 


"Wir benutzen die algebraische Umformung 


2ar — Bea + = (8 Peer) +5 (- za) ts 


daraus ergibt sich 


2a? — 2zc + 22 
2 = 2 4 


2.9. Funktionen von mehrdimensionalen Zufallsvariablen 83 


also 


j 2 
Wenn wir in dem letzten Integral vu = x y2 — —— substituieren, erhalten wir 
2 . 


2 
1 “ (W- 7) 1 f u\ ; 
— Iexpl|l - —- |ldıe= — epi—- —Idu=1, 
j 2 2 
Yr 27 
00 x ä 


woraus schließlich 


(2) = 2 ex (- 2) 
Yy ayr P 4 


folgt. Die Verteilungsfunktion F(z) wird also durch die Formel 


gegeben. 

Wir überlassen es dem Leser zur Übung, die Formeln für die Verteilungsfunk- 
tion und für die Dichte der Differenz zweier Zufallsvariabler herzuleiten. 

Wir betrachten jetzt das Produkt zweier Zufallsvariabler X und Y, die die zwei- 
dimensionale Dichte f(x, y) und die Randdichten f, (x) bzw. /,(y) haben. Wir-setzen 


Z2—=-XY (2.9.12) 
und schreiben diese Gleichung in Form eines Gleichungssystems: 
X=X, = 2 B 
X 
Es ist 
01 
F 1 el, u x 
x 
Iso [I] = 
also = 07. 
El 
6* 
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Aus (2.9.3) folgt, daß die zweidimensionale Dichte der Zufallsvariablen (Z, X) 


gleich 
lo 2) = | | (2.9.13) 


ist. Die Dichte »(e) der Zufallsvariablen Z erhalten wir durch Integration des Aus- 


drucks (2.9.13) nach x von — oo bis oo: 


yle) = f f (r .) - de.. (2.9.14) 


Die Verteilungsfunktion von Z hat die Form 


vo-[ f (e 2) (2.9.15) 


x 0 


.Wenn X und Y unabhängig sind, dann nehmen die Gleichungen (2.9.14) bzw. 
(2.9.15) folgende Form an: 


x 


ve) = ef (2) dz | (2.9.14) 
|| x 


oo 


B \ z oo 
Fi) -[ [rer (-) de de. (2.9.15) 


Wir können wegen der Symmetrie des Produkts in den Formeln (2.9.14), 


(2.9.14), (2.9.15) und (2.9.15’) x durch z X durch y und |x| durch |y| ersetzen. 
yx 


bzw. 


Für den Quotienten zweier Zufallsvariabler X und Y 


Ge 
Y 


erhalten wir die Formeln 


= fyz, y) Iyldy (2.9.16) 
und = = 
= [ [tW= Wlyldyde. (2.9.17). 


= —o 
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Wenn die Zufallsvariablen X und Y unabhängig sind, ergibt sich 


ve) = | hwahw)iyldy, (2.9.16) 
Fr@a=[ [hwalWlyldydz. (2.9.17) 


Die Formeln für die Verteilung der Summe, der Differenz, des Produktes und 
des Quotienten zweier unabhängiger Zufallsvariabler X und Y ohne die Annahme, 
daß der Zufallsvektor (X, Y‘) stetig ist, sind in 6.5 angegeben. (Wegen der Beweise 
für diese Formeln siehe den Anhang.) 


2.10. Schlußbemerkungen 


In diesem Kapitel haben wir Zufallsvektoren betrachtet und damit Zufalls- 
variable, die Werte aus einem endlichdimensionalen euklidischen Raum annehmen. 
Kürzlich hat sich eine Theorie allgemeinerer Zufallsvariabler entwickelt, und zwar 
die Theorie der Zufallsvariablen, deren Werte in einem unendlichdimensionalen 
Raum, etwa in einem Funktionalraum liegen. Einige Bemerkungen zu diesem 
Thema werden wir in 8.1 behandeln. Die fundamentalen Informationen über diese 
Theorie finden wir in den Arbeiten von KoLMmoGorRorr [8], MoURIER [1], PRocHo- 
Row [3], GETOOR [2] sowie in den Monographien von Doos [5] und Lokve [4]. 


2.11. Aufgaben und Ergänzungen 


1. Es sei X eine Zufallsvariable. Ist dann auch |X| eine Zufallsvariable? _ 
2. Die Wahrscheinlichkeitsfunktion einer Zufallsvariablen X hat die Form 


T 


PX=rn=e% z (=0,1,2,...). 


Man bestimme die Wahrscheinlichkeitsfunktion der folgenden Zufallsvariablen: a) 
Y=-X,b)Y=aX+50Y=X%,d)Y= Yx: e) Y = X! (l ganzzahlig). 
3. Die Funktionen F (x) bzw. /(x) seien die Verteilung bzw. die Dichte der Zufallsvariablen X. 


1 
Man bestimme die Verteilung und die Dichte der folgenden Zufallsvariablen: a Y’= — 


)Y=el,0)Y=snX,d)Y=|X|,e)Y=F(X). & 
4. Die Verteilung des Vektors (X, Y) sei durch die folgenden Formeln gegeben: 
; 1 
PZXZ=LIY-U-PX=1LWY=)=PX=217=-2)=7. 


a) Man bestimme die Verteilungsfunktionen F (x, y), F(x) und F,(y). 
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10. 


1 1\ 
b) Man stelle fest, ob die Punkte (% 5) (1,3), (e :) und (2,3) Unstetigkeitspunkte von 
F (x, y) sind. 2 


. Die Wahrscheinlichkeitstunktion des Zufallsvektors (X, Y) hat die Form 


1 
PIX=0,1< Y<N=PISX<S2, 7=-0)=-,. 


a) Man bestimme die Unstetigkeitspunkte der Verteilungsfunktion F (x, y). 


1 1 
b) Man überprüfe, ob das Rechteck mit den Eckpunkten (0,0), (2, 0), (e ;) una :) 
ein Stetigkeitsrechteck ist. z 


. Man beweise die Formel (2.5.12) 


a) fürn =3, 
k) für ein beliebiges n. 


. Man gebe ein Beispiel dreier abhängiger Zufallsvariabler X, Y und Z an, die paarweise 


unabhängig sind. 


Hinweis. Sollten dem Leser keine anderen Beispiele einfallen, so kann er das Beispiel 
1.7.1 entsprechend modifizieren. Weitere Beispiele findet der Leser in der Arbeit von 
GEISSER und MANTEL [1]. . 


. Die Funktion F(x,y) bzw. f(x, y) seien die Verteilungsfunktion bzw. die Dichte eines 


Zufallsvektors (X, Y). Man bestimme die Verteilungsfunktion und die Dichte des Zufalls- 
vektors (Z, U), der durch die folgenden Formeln definiert ist: 


Z=aX+bY+re, 
U=dX+eY+f. 


. Die Zufallsvariablen X,, X,, ..:, X, seien unabhängig. Man beweise: 


&) Ist wenigstens eines der X, stetig, so ist auch die Summe X, + X, +---+ X, stetig; 


b) besitzt wenigstens eines der X, eine stetige Verteilungsfunktion, so ist auch die Ver- 
teilungsfunktion der Summe X, + X, +++ X, stetig. 


Hinweis. Man verwende die Formel (6.5.6). 


Man beweise, daß die Sätze a) und b) der vorhergehenden Aufgabe nicht mehr gelten, 
wenn man die Voraussetzung der Unabhängigkeit fallen läßt. 


Hinweis. Man gebe ein Beispiel an. 


3. DIE PARAMETER DER VERTEILUNG 
EINER ZUFALLSVARIABLEN 


3.1. Der Mittelwert 


Mit der Verteilung einer Zufallsvariablen hängen gewisse Größen, die Parameter 
der Verteilung, zusammen, die eine große Rolle in der mathematischen Statistik 
spielen. Solche Parameter sind die Momente und ihre Funktionen sowie die Lage- 
parameter. Wir wollen sie der Reihe nach kennenlernen. 

Es sei X eine Zufallsvariable. Wir betrachten die eindeutige Funktion g(X) 
der Zufallsvariablen X. 


Definition 3.1:1. Es sei X eine diskrete Zufallsvariable mit den Sprungstellen 
x, und den Sprunghöhen 7;. Ist die Ungleichung 
Zplg (1 <o 8.1.1’) 
erfüllt, so nennen wir die Reihe 
Ira) | (2.1. 


den Mittelwert E[g(X)] der Zufallsvariablen g(X). 


Definition 3,1.2. Es sei X eine stetige Zufallsvariable mit der Diehtefunktion 
tx). Die Funktion g (x) sei im Riemannschen Sinne integrierbar. Ist dieUngleichung 


Ist@ fe) de < (3.1.2) 


00 


erfüllt, so nennen wir das Integral 


[ste re) dx | | (3.1.2) 


den Mittelwert E{g (X)] der Zufallsvariablen g(X). 

Wir bemerken noch einmal, daß der Mittelwert der Zutaisvariablen g(X) nicht 
existiert, wenn zwar (3.1.1) existiert, die “Ungleichung (3.1.1’) aber nicht erfüllt 
ist. 

Ebenso existiert auch E[g(X)] nicht, wenn zwar (3.1.2) existiert (konvergiert), 
die Ungleichung (3.1.2’) aber nicht erfüllt ist. 

Es sei g(X) =X. Die durch (3.1.1) bzw. (3. l) 2) definierte Größe nennen wir 
den Mittelwert der Zufallsvariablen X. 
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Den Mittelwert E(X) nennt man manchmal die mathematische Erwartung!) 
oder auch den Erwartungswert der Zujallsvariablen X. (Wegen der Definition von 
E(X) siehe auch den Anhang.) 

Wir zeigen, daß die Definition des Mittelwertes der Funktion g(X) eindeutig 
ist: Setzen wir 7 =g(X) und berechnen wir den Mittelwert E(Y')) unmittelbar 
aus der Verteilung der Zufallsvariablen Y, so erhalten wir dasselbe Ergebnis, 
nämlich E[g(X)], als wenn wir diesen Mittelwert nach der Definition 3.1.1 bzw. 
3.1.2 aus der Verteilung von X berechnen. Wir beschränken uns auf den Beweis 
für den Fall einer diskreten Zufallsvariablen. 

Es habe X also die Sprungstellen x, und die Sprunghöhen 2, und Y die Sprung- 
stellen y; und die Sprunghöhen q,. Dann it ;= DV m =1,2,...); dabei 


j ar)=Y 
betrifft die Summationsvorschrift alle &, für die die Gleichung 9) = y; gilt. 
Da nach der Voraussetzung über die Existenz des Mittelwertes E[g(X)] die 
Reihe .I’p;g (x,) absolut konvergiert, kann man ihre Glieder beliebig umordnen. 
5% 


Also erhalten wir 
Y= 2a = 2 749%) = Elg(Ä). 
3 ß 


Wir bringen einige Beispiele einer Mittelwertberechnung. 


Beispiel 3.1.1. Wir nehmen an, daß die Zufallsvariable X zwei Werte annehmen kann: 
x, = —1 mit der Wahrscheinlichkeit p, = 0,1 und 2, = +1 mit der Wahrscheinlichkeit 
P2= 09. 

Der Mittelwert dieser Zufallsvariablen X ist 


E(X) =0,1-(-1) 40,9. (+1) = 


Beispiel 3.1.2. Die Zufallsvariable X kann die Werte k = ® 1,2,... mit der Wahr- 
scheinlichkeit 


. j 
PX=k = — Er (3.1.3) 


annehmen, wobei A eine gewisse positive Konstante ist. Die Formel (3.1.3) stellt eine so- 
genannte Poissonsche Verteilung dar. 
Wir berechnen den Mittelwert der Zufallsvariablen X: 


x Ak x Ak a jr 
E(X) = N keit _ = ie =IeN ide. 3.1.4) 
an ann > 


Beispiel 3.1.3. Die Zufallsvariable X kann die Werte r = 0, 1,2, ...,» mit der Wahr- 
scheinlichkeit 


PX=n= nenn Pit p"t (3.1.5) 
ran — r)! 5 


1) Das Symbol E(X) rührt vom französischen „esperance‘ (Hoffnung) her. 
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annehmen; dabei ist p eine gewisse Konstante, die die Ungleichung 0 <p< 1 erfüllt. Eine 
derartige Verteilung nennen wir Binomielverteilung, da auf der rechten Seite der Gleichung 
(3.1.5) die Glieder des nach dem binomischen Satz entwickelten Binoms [» + (1 — p)® 
stehen. j 

In einer Warenladung befinden sich gute und fehlerhafte Exemplare. Die Wahrscheinlich- 
keit, daß ein willkürlich gewähltes Exemplar gut ist, betrage 2. Wir setzen voraus, daß bei 
einer zufälligen Auswahl von n Exemplaren die aufeinanderfolgenden Ereignisse, die darin 
bestehen, daß man beim k-ten Mal (k< n) ein gutes Exemplar zieht, voneinander unabhängig 
sind (dies kann man zum Beispiel dadurch erreichen, daß man das schon gewählte Exemplar 
vor der Wahl des nächsten zurückgibt). Die Wahrscheinlichkeit, daß unter den n gewählten | 
Exemplaren r gute vorhanden sind, wird durch die Formel (3.1.5) angegeben. Die Herleitung 
dieser Formel ist sehr einfach. 

Wir bezeichnen ein fehlerhaftes Exemplar mit / und ein gutes mit g. Da die einzelnen 
aufeinanderfolgenden Ereignisse / und g unabhängig sein sollen, erhalten wir für die Wahr- 
scheinlichkeit einer bestimmten Buchstabenanordnung, in der r-mal der Buchstabe g und 
{n — r)-mal der Buchstabe f auitritt, die Formel 


el pr". 


Die Gesamtzahl solcher Anordnungen {r-mal g und (n — r)-mal f} ist gleich 


n\ n! 
e = rn — nr)! 


Wir erhalten also (je zwei verschiedene Anordnungen schließen einander natürlich aus) die 
Formel (3.1.5). 
Der Mittelwert dieser Zufalisvariablen X ist gleich 


a a! 
BD-Ir nn rü-e 
= A en 1 re 
2” erg, 223 ed! a ne 2 
np Fiat Hr Pi etrenpp+i—-pt=np. 
io Ani hl 


(3.1.6) 


Beispiel 3.1.4. Die Zufailsvariable X sei stetig und habe die Dichte /(«), die durch die 
Formel 


ER 
2 


a 
Y en Y2r 


gegeben wird. Der Mittelwert dieser Zufallsvariablen ist gleich 


En Fe 1 _ 2 jo 
E(X % = = FSBHETENEHIIEEN 2 —=f, 
ER af fe : | E 


Wir geben jetzt zwei Beispiele für Zufallsvariable an, die keinen Mittelwert haben. 
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2% 
Beispiel 3.1.5. Die Zufallsvariable X möge die Werte x, = (—1j% E (k=1,2,...) mit 


: 1 
den Wahrscheinlichkeiten p, = Fr annehmen. Wir erhalten 


x oo 1 
> Dr% = (2 Fe -log2. 
k=1 k=1 


Für diese Zufallsvariable existiert Z#(X) jedoch nicht; denn es ist 


oo x 1 
Zmml=3 ——o. (3.1.7) 
k=1 k=1 


Beispiel 3.1.6. Wir betrachten die Zufallsvariable 7 = |X |, wobei X dieselbe Verteilung 
wie im vorhergehenden Beispiel hat. Aus (3.1.7) erkennt man, daß Y keinen Mittelwert hat. 


In Kapitel 5 bringen wir ein Beispiel für eine stetige Zufallsvariable, die keinen 
Mittelwert besitzt. 


3.2, Die Momente 


A. Der in 3.1 behandelte Mittelwert E(X) gehört zu einer Gruppe von Para- 
metern, die Momente genannt werden. 


Definition 3.2.1. Wir nennen den. Mittelwert der Funktion g(X) = X# 
das Moment k-ter Ordnung der Zufallsvariablen X und schreiben m; = E(X#). 

Ist also X eine diskrete Zufallsvariable mit den Sprungstellen x, und den Sprung- 
höhen p, dann ist nach (3.1.1) das Moment &k-ter Ordnung gleich 


m; = E(X*) = Ian. (3.2.1) 


Ist die Zufallsvariable X stetig mit der Dichte f(x), dann ist nach (3.1.2) das 
k-te Moment gleich 


oo 
m; = E(X}) = ji ara) de. (3.2.2) 
00 
Wir erinnern daran, daß für die Existenz des Moments m, die absolute Konver- 
genz der Reihe (3.2.1) oder des Integrals (3.2.2) notwendig ist. Daraus folgt: 
Existiert das Moment k-ter Ordnung, so existieren auch alle Momente einer Ord- 
nung kleiner als k. 
Wie wir sehen, besteht für den Fall, daß das Moment k-ter Ordnung der Zu- 
fallsvariablen X existiert, die Relation 
ima#P(X|>a)=0 («e>0). 
. 04->00 
Es gilt nämlich, falls wir die Existenz des Moments &k-ter Ordnung berück- 
sichtigen (den Beweis bringen wir für stetige Zufallsvariable mit der Dichte f(«)), 
lim a®P(|X| > a) < lim if lelf(a)da=0. 


0>X 4a>X lel>a 
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Die bewiesene Relation können wir in der anschaulicheren Form 
1 
P(X|>a)=o (2) 
@ 


schreiben. Wie man sieht, hängt die Existenz der Momente von der Wahrschein- 
lichkeit ab, mit welcher die Zufallsvariable, absolut genommen, große Werte an- 
nimmt. Ist die Menge der möglichen Werte, die die Zufallsvariable annimmt, 
beiderseitig beschränkt, so existieren selbstverständlich Momente beliebiger 
Ordnung. 

Es seien 9,(X) und 9,(X) zwei eindeutige Funktionen der Zufallsvariablen X, 
und es mögen die Mittelwerte Z[g,(X)] und F[g,(X)] existieren. Wir werden 
zeigen, daß die Gleichung 


ER + El (A) (8.2.3) 


besteht. 
Zum Beweis beschränken wir uns auf den Fall einer stetigen Zufallsvariablen X. 
Dann ist 


Ei KM + HM] = [ Ile) + gel@)]f(@) de. (38.2.4) 


Da nach Voraussetzung die beiden Ungleiehungen 


[In li@) de <®, 


fire) da < oo 
erfüllt sind, existiert auch der Mittelwert der Summe 9,(X) + 9,(X); denn es ist 
Se Ar 92a) fe) dx < Ina) dx + intra) de. 
Also erhalten wir aus (3.2.4) 
Ela (X) +0] = fi ee ale 


= El (+ Ele(N]. 


Die Formel (3.2.3) ist damit bewiesen. Man kann sie leicht auf endlich viele 
Summanden verallgemeinern. 
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Es wird dem Leser ohne Schwierigkeiten gelingen, die Formel 
E[(aX)] = «FE (X), (3.2.5) 


wobei a ein konstanter Koeffizient ist, zu beweisen. 
Wenn wir außerdem noch berücksichtigen, daß für eine beliebige Konstante b 
die Gleichung 


E(b) =b 
gilt, so erhalten wir 
E(aX +b)=aE(X)-+b. - (3.2.6) 
Beispiel 3.2.1. Die Zufallsvariable X kann die Werte 2 und 4 mit den Wahrscheinlichkeiten 
P(X=2)=0,2 und P(X=4) = 0,8 annehmen. Gesucht ist Z#(X?). Aus (3.2.1) erhalten wir 
E(X?) = 4-02 --16-0,8= 13,6. 


Beispiel 3.2.2. Die Zufallsvariable X sei normal verteilt mit der Dichte 


a? 
a: 


j 1 
an 


Gesucht ist E(X?2). Benutzen wir die Formel (3.2.2) und integrieren partiell, so erhälten wir 


Man kann auch Ausdrücke der Form 
EX — ec) (3.2.7) 
berechnen, wobei 6 eine beliebige Konstante ist. 


Definition 3.2.2. Den Ausdruck (3.2.7) nennen wir Moment k-ter Ordnung in 
bezug auf den Punkt ec. 

Eine besonders wichtige Rolle spielen die Momente in bezug auf den Mittelwert, 
das heißt in bezug auf den Punkt c=m, =E(X). 


Definition 3.2.3. Die Momente in bezug auf den Mittelwert heißen zentrale 
Momente. j 
Wir bezeichnen sie mit a,. Es ist also 


iy = EIX — B(X JE. | (3.2.8) 
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Die Momente in bezug auf den Punkt c —=0 nennen wir gewöhnliche Momente. 

Wenn wir den Ausdruck (3.2.8) umformen, können wir nach Berücksichtigung 
der Gleichung (3.2.3) die zentralen Momente durch ihre gewöhnlichen Momente 
ausdrücken. Für die ersten drei zentralen Momente erhalten wir 


hi =E[IX —-— EX) =E(iX — m) =E(X)- m =m—-m=0, 
Mg = E[X — E(X)}? = B[(X — m,)?] 

= E(X?) — 2m, E(X) + mi = m, — mi, 
Mg = EIX — E(X)P = EX — m,)?] 

= E(X®) — 3m, E(X®%) + 3miE(X) — mi 


= Ms — 3m Mm, + 3m? — m? = m, — 3m, m, + 2m}. 
3 102 ı T: 3 1:72 1 


(3.2.9) 


Wir wollen uns eingehender mit dem Fall k = 2 beschäftigen. Das Moment 
BLX — e)] 


nennen wir auch die mittlere quadratische Abweichung der Zufallsvariablen X vom 
Punkt c. 


Definition 3.2.4. Das zentrale Moment zweiter Ordnung oder die mittlere 
quadratische Abweichung der Zufallsvariablen X vom Mittelwert m nennen wir 
Dispersion oder Varianz. 

Es ist üblich, die Dispersion mit D?(X) oder mit o? zu bezeichnen. Auch die 
Bezeichnung D(X) findet sich in der Literatur. Aus den Formeln (3.2.9) erhalten 
wir 

D(X)=0=m, — m. (3.2.10) 

Der Parameter 0? ist ein Maß für die Streuung einer Zufallsvariablen um ihren 
Mittelwert. Je mehr sich eine Verteilung um den Mittelwert häuft, desto kleiner ist 
der Wert von o2. 


Definition 3.2.5. Die Quadratwurzel aus der Dispersion nennen wir die 
Standardabweichung. 


Beispiel 3.2.3. Wir berechnen die Dispersion für eine Binomialverteilung (siehe Beispiel 
3.1.3), für die 


PX=n= () Pape (=0,1,..,n) 


ist. Gehen wir ganz analog wie bei der Berechnung von EX) in Beispiel 3.1.3 vor, so erhalten 
wir 
R F z 
EXy)=,%r () Pi p"T=pn(g+ pn), 
0 
wobeig=1-— p ist. Es ist E(X)= pn. Auf Grund von (3.2.10) erhalten wir daher die 
Formel 


D2(X) = pn(q + pn) — pin? = pqn. (3.2.11) 
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Es sei etwa n = 2. Die Zufallsvariable kann also einen der Werte 0, 1, 2 annehmen. Ist 
außerdem p = . so folgt E(X) = 5 : =1. 

Die durch die Größen n=2,p = 5; gegebene Verteilung ist in Abb. 3.2.1 dargestellt; 
dabei sind die Werte der Zufallsvariablen als Abszissen und die Wahrscheinlichkeiten dieser 


Werte als Ordinaten gewählt worden. 


PiX=x)! 


0 1 2 x Abb. 3.2.1 


Die Dispersion der Verteilung beträgt auf Grund der Gleichung (3.2.11) 


DX)= : 
1 
Es seinun»=3 undp = 5 Die Zufallsvariable X kann dann die Werte 0, 1, 2, 3 an- 
A A \ 
nehmen. Wir erhalten Z(X) = a 3 = 1. Der Mittelwert ist derselbe wie vorher; die 


Dispersion ist aber größer; sie beträgt 


1 


2 
DN)=27,:3= 


3 ‚ 
Die entsprechende Verteilung ist in Abb. 3.2.2 dargestellt. 


Nies 
en 
SI 
Nloı 


1 
27] 
2 3 x : Abb. 3.2.2 


S 
-. 


Wenn wir Abb. 3.2.1 und 3.2.2 vergleichen, sehen wir, daß im zweiten Fall die 
Streuung der Werte der Zufallsvariablen X um den Mittelwert 1 größer ist als im 
ersten Fall. Durch diese Beispiele wird erläutert, daß die Dispersion als Streuungs- 
maß dienen kann. 
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Die Dispersion besitzt die folgende wichtige Eigenschaft: Für jedes c+ m, 
gilt die Ungleichung 


D2(X) <E[LX — 0)2]. (3.2.12) 
Aus (3.2.3), (3.2.5) und (3.2.9) folgt nämlich 
EL(X — 0] = EX — m + mı — 0)2] 
= E[I(X — m,)?] + 2m, — c)E(X — m,) + (m, — c)% 
= D(X) + (m — 02. 
Wenn wir berücksichtigen, daß nach Voraussetzung (m, — 6)? #0 ist, so erhalten 
wir die Ungleichung (3.2.12). 


Wir wollen jetzt die Dispersion einer linearen Funktion der Zufallsvariablen X 
berechnen. Es sei Y = X -+-c. Dann erhalten wir 


D(Y)=E[Y- En) 
= BE[X +c— E(X) — Eie)]® (3.2.13) 
— BIX — B(XP = D2(X). 


Wir sagen, die Dispersion sei iranslationsinvariant, da eine Verschiebung ihren 
Wert nicht ändert. 
Es sei nun 


Y=aX-+b. 
Berücksichtigen wir (3.2.3), (3.2.5) und (3.2.10), so erhalten wir 
D’(Y) = E[(aX + 5)?] — [E(aX + b)P = a®E (X?) — a?lE (X)? 


= a{E(X2) — (E(X))] = a D2(X). (3.2.14) 


Definition 3.2.6. Eine Zufallsvariable X, für die die Gleichungen 
EX)=0, D(X=1 


gelten, nennt man normiert oder standardisiert. 

Hat eine Zufallsvariable X den Mittelwert m, und die Standardabweichung o, 
dann ist die durch 
X—- Mm 


Y= 
(02 


definierte Zufallsvariable Y normiert. Aus den Formeln (3.2.6) und (3.2.14) er- 
halten wir nämlich Z(7)=0 und D2(Y) =1. 
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Als Streuungsmaß kann außer der Standardabweichung die sogenannte mittlere 
Abweichung dienen, die durch 


SZ ale — ml (3.2.15) 
-o<<o 
definiert wird, wenn X eine diskrete Zufallsvariable mit den Sprungstellen x; ist, 
bzw. durch 
oo 
[I - mlfte) de, (3.2.15) 
0 
wenn X eine stetige Zufallsvariabie ist. 
Im zweiten 'Teil dieses Buches werden wir uns mit Kriterien befassen, die zu 
entscheiden erlauben, welches dieser Streuungsmaße besser ist. 
Manchmal ist es vorteilhafter, die Streuung nicht unmittelbar durch die Stan- 
dardabweichung, sondern durch das Verhältnis dieser Abweichung zum Mittel- 
wert zu charakterisieren. Dieses Verhältnis ist ebenfalls ein Verteilungsparameter. 


Definition 3.2.7. Das Verhältnis der Standardabweichung zum Mittelwert 
nennen wir den Variationskoeffizienten und bezeichnen ihn mit v. Es ist also 


vu —. {3.2.16) 

Der Variationskoeffizient v ist gleich der Standardabweichung, falis der Mittel- 

wert gleich Eins ist. Mit anderen Worten: Der Variationskoeffizient ist ein 
Streuungsmaß mit dem Mittelwert als Einheit. 


Beispiel 3.2.4. Wir haben vorhin festgestellt, daß für die Binomislverteilung der Mittel- 


wert gleich np (siehe Beispiel 3.1.3), die Standardabweichung dagegen gleich Yngp ist (siehe 
Beispiel 3.2.3). Der Variationskoeffizient wird also für die Binomialverteilung durch die 
Formel 


ee 
NP np 
gegeben. 


B. Wir führen jetzt den Begriff einer symmetrischen Verteilung ein. 


Definition 3.2.8. Wir sagen, daß die Zufallsvariable X symmetrisch verteilt 
ist, wenn ein Punkt « existiert, so daß die Verteilungsfunktion F(x) von X für 
jeden Wert von z die Gleichung 


Fa—a\=1—-Fla+tz)—- PX=a-+e) 


erfüllt. Den Punkt a nennen wir Symmelriezentrum. 
Insbesondere gilt, falls a = 0, für jeden Wert von « 


F-a)=1-—- Fi) - P(X=n). 
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Wenn eine stetige Zufallsvariable symmetrisch verteilt ist, erfüllt ihre Dichte 
f(x) die Gleichung (die eventuellen Unstetigkeitspunkte von f(x) ausgenommen) 


fa-2)=fla+a). 


Ist eine diskrete Zufallsvariable X symmetrisch verteilt, so liegen ihre Sprung- 
stellen und Sprunghöhen symmetrisch in bezug auf das Symmetriezentrum. Also 
können wir abschließend zusammenfassen: 

Ist eine Zufallsvariable symmetrisch verteilt und besitzt sie einen endlichen 
Mittelwert, so ist dieser Mittelwert auch gleichzeitig Symmetriezentrum. 

Daraus folgt weiter: Für eine symmetrische Verteilung sind die zentralen 
Momente ungerader Ordnung, wenn sie existieren, gleich Null. 

Manchmal ist es nötig, den Grad der Asymmetrie einer Verteilung abzuschätzen. 
Da für eine symmetrische Verteilung alle ungeraden zentralen Momente gleich 
Null sind, kann also die Größe eines jeden ungeraden Moments als Maß für die 
Asymmetrie dienen. Es ist vorteilhaft, diese Größe mit einem Maßstab zu messen, 
in dem die Einheit gleich der Standardabweichung ist. 

Deshalb nimmt man gewöhnlich als Maß für die Asymmetrie den durch 


— & 
ee 


(3.2.17) 


definierten Ausdruck und nennt ihn den Koeffizienten der Asymmetrie oder kurz 
die Schiefe. Dieser Koeffizient kann positiv oder negativ sein; je nach dem Vor- 
zeichen sprechen wir also von einer positiven oder negativen Schiefe. 


€. Wir machen nun einige Bemerkungen zum Problem, die Verteilungsfunktion 
F(x) einer Zufallsvariablen X eindeutig zu bestimmen, wenn alle Momente 
m: = E(X") (k=1,2,...) existieren und bekannt sind. Wir begnügen uns hier 
damit, den nachstehenden Satz ohne Beweis anzugeben (siehe Aufgabe 4.8.10): 


Satz 3.2.1. Es mögen die Momente m, (k =1,2,...) der Zufallsvariablen X 
existieren, und es sei die Reihe 


SM 
Am” | 

für ein gewisses r >0 absolut konvergent. Dann bestimmt die Menge {m,} der 
Momente die Verteilungsfunktion F (x) der Zufallsvariablen X eindeutig. 

Insbesondere folgt aus diesem Satz: Gilt für eine gewisse Konstante M die 
Ungleichung |m.| < M"(k =1,2,...), so bestimmen die Momente die Ver- 
teilungsfunktion F(x) eindeutig. Ist somit die Menge aller möglichen Werte der 
Zufallsvariablen X nach beiden Seiten beschränkt, so ist F(x) durch {m;} ein- 
deutig bestimmt. 

Fxistieren jedoch nicht alle diese Momente, so genügen die existierenden 
Momente nicht, um die Verteilungsfunktion F(x) zu bestimmen, wie dies aus dem 
nachstehenden Beispiel hervorgeht. 


7 Fisz 
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Beispiel 3.2.5. Die Zufallsvariable X möge die Werte x, = 2#/k® (k= 1,2, ...) mit der 
Wahrscheinlichkeit p, = 1/2" annehmen. 
Es gilt 
1 
-5 PET > 12 <@, 


x © 9h 

2 Er Pen 
> 2 = Fi ©. 
k=1 k=1 


Nun möge die Zufallsvariable Y die Werte y, = 2#+1/R2 (k= 1,2, ....) mit der Wahrschein- 
lichkeit p7, = 1/2"! und den Wert 0 mit der Wahrscheinlichkeit 27 annehmen. Dann gilt 


x 


= 1 
EN=Nyun=dn-ER), 
k=1 k=1 


© © gl 
Zum= 3 an @ 
k=1 k=1 


Die Zufallsvariablen X und Y haben gleiche. Momente erster Ordnung und weisen keine 
Momente von höherer als erster Ordnung auf. Die Verteilungen dieser Variablen sind aber 
offenbar voneinander verschieden. 


Dem Problem, eine Verteilung mit Hilfe der Momente zu bestimmen, sind viele 
mathematische Arbeiten gewidmet. Es seien hier die Arbeiten von STIELTIES [1] 
und HAMBURGER [1] erwähnt. 

Eine Bedingung dafür, daß die Verteilung einer zweidimensionalen Zufalls- 
variablen durch die Momente bestimmt ist, haben CRAMER und Worp [1] an- 
gegeben. 


3.3. Die Tschebyscheifsche Ungleichung 


Die Rolle der Standardabweichung als Parameter, der die Streuung charakterisiert, 
wird besonders deutlich an der berühmten T'schebyscheffschen Ungleichung 


P(X —m|>2ko)< (3.3.1) 


i 
m’ 
die für jedes positive % gilt. Die Tschebyscheffsche Ungleichung ist eine Folgerung 
aus dem nachstehenden Satz: 


Satz 3.3.1. Nimmt eine Zufallsvariable Y nur nichtnegative Werte an und 
besitzt sie einen endlichen Mittelwert E(Y), so ist für jede positive Zahl K die Un- 
gleichung 
zn 


Pranz 
K 


(3.3.2) 
erfüllt. 
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Beweis. Wir beweisen diesen Satz für stetige Zufallsvariable. (Der Beweis 
für diskrete Zufallsvariable verläuft analog.) Es ist 


Daraus folgt sofort die Ungleichung (3.2.2). 
Es sei nun X eine Zufallsvariable mit dem Mittelwert E(X) = m, und der 
Standardabweichung o. Wir betrachten die Zufallsvariable 


Y=X— m). (3.3.3) 


Sie erfüllt die Voraussetzungen des Satzes 3.3.1, da 7” > 0 ist und Z(Y) existiert; 
dabei ist 


E(Y)=E[(X — m)! = 0%. 


. Wenn wir die Konstante K gleich k?0? setzen, erhalten wir aus (3.3.2) 
PI[X —- m)? 2 Ro) s = (3.3.4) 


Die Ungleichung (3.3.4) ist der Tschebyscheffschen Ungleichung (3.3.1) äqui- 
valent. 

Die Ungleichung (3.3.1) gilt für beliebige Zufallsvariable, die eine endliche 
Dispersion haben. 

Wenn wir in (3.3.1) zum Beispiel den Wert k = 3 einsetzen, erhalten wir 


PIX— m|230]s 


Die Ischebyscheffsche Ungleichung zeigt also, daß die Standardabweichung o 
als Streuungsmaß dienen kann. 

Aus dem nachstehenden Beispiel geht hervor, daß man in der Klasse der 
Zufallsvariablen, deren Moment zweiter Ordnung existiert, keine bessere Un- 
gleichung gewinnen kann als die Tschebyscheffsche Ungleichung. 


Beispiel 3.3.1. Die Zufallsvariable X möge eine Wahrscheinlichkeitsfunktion haben, 
die durch die Formel 


PX=-k)=PX=k=1j2l?, 
PX =0)=1-- 1/k 


7* 
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gegeben ist, wobei k eine gewisse positive Zahl bedeutet. Es gilt hierm = 0,6 = 1, und für das 
betrachtete k ist somit 


P(IX—m|2 ko) = P(X|2b)=P(X=—k) + PX=k)=1jk. 


- Es sei darauf hingewiesen, daß man in kleineren Klassen. von Zufallsvariablen, 
z. B. in Klassen, deren Moment von der Ordnung. 2n (n > 1) existiert, eine bessere 
Abschätzung erzielen kann als die Ungleichung (3.3.1) (vgl. hierzu CRAMER 
[2)). 

Ein Analogon zur Tschebyscheffschen Ungleichung für zweidimensionale 
Zufallsvariable (vgl. Aufgabe 3.9.9) hat Berce [1] angegeben; für Zufallsvektoren 
beliebig hoher endlicher Dimension stammt eine entsprechende Ungleichung 
von OLKINn und PrArT [1]. In 6.12.B werden wir die Ungleichung von KoLMo- 
GOROFF angeben, die eine weitgehende Verallgemeinerung der Tschebyscheffschen 
Ungleichung für Summen von unabhängigen Zufallsvariablen darstellt. 


3.4. Absolute Momente 


Definition 3.4.1. Wir nennen den Ausdruck E[|X|Fj das absolute Moment 
k-ter Ordnung. 

Absolute Momente wollen wir mit ß, bezeichnen. 

Wenn X eine diskrete Zufallsvariable mit den Sprungstellen «; ist, dann ist 


Pr = EX] = ls" pi. (3.4.1) 


Ist X eine stetige Zufallsvariable, dann ist 


B 


= EIIX] = [ elf) de. (3.4.1') 


-o 


Das absolute Moment gerader Ordnung ist gleich dem gewöhnlichen Moment 
derselben Ordnung. 

Wie wir wissen (vgl. 3.2), folgt aus der Existenz des gewöhnlichen Moments 
k-ter Ordnung die Existenz des absoluten Moments k-ter Ordnung und auch die 
Existenz aller absoluten Momente einer Ordnung, die kleiner als % ist. 

Wir beweisen jetzt den folgenden Satz für die absoluten Momente, der nach 
LJAPUNORFF [1] benannt wird: 


Satz 3.4.1. Existiert das absolute Moment n-ter Ordnung einer Zufallsvariablen 
X, dann gilt fürk = 1,2, ....,n — 1 die Ungleichung 


1 1 
zen, ® (3.4.2) 
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Beweis. Die Zufallsvariable X sei stetig, u und v seien beliebige reelle Zahlen. 
Wir betrachten den nichtnegativen Ausdruck 


oo 


Sue? : + 9fal® | ie)de 


= [nal + 2uvleje + 22laiet] fie) de — Braut + Yruo + Bra. 
en (3.4.3) 


Da die quadratische Form auf der rechten Seite der Gleichung (3.4.3) ihr Vor- 
zeichen nicht ändert, gilt 


%— Braßen 0 oder ES Praßern: (3.4.4) 
Erheben wir beide Seiten von (3.4.4) in die k-te Potenz, so erhalten wir 
Br S A-ıßi- (3.4.5) 


Nimmt hier % die Werte 1,2,.. % n — lan, so folgt 


PS Boß, mit PB, = [ 21° f(@)de=1, 
= Pißz; 3 

B= RR: 

Br < 7 her 


Wenn wir die Seiten von % aufeinanderfolgenden Ungleichungen miteinander 


multiplizieren und beachten, daß ß, = 1 ist, erhalten wir fürk =1,2,..,n — 1 
die Ungleichung 
Bi < Pia: (3.4.6) 


Erheben wir noch die beiden Seiten der ogleiekeng. (3.4.6) in die Potenz 
on, so erhalten wir (3.4.2). 
k(k +1) 

Der Beweis der Ljapunoffschen Ungleichung für eine diskrete Zufallsvariable 
verläuft analog. 


3.5. Die Lageparameter 
Definition 3.5.1. Ein Wert x, der die Ungleichungen 


P&<o>2J, PiX22)2, (3.5.1) 


erfüllt, nennen wir Zentralwert oder Mediane und bezeichnen ihn mit 1. 
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Das Ungleichungspaar (3.5.1) ist der. Dappelungleichung 


1 _PiX=a)<F(R)< 


3 (3.5.1') 


vo im 


äquivalent. 
Ist die Zufallsvariable X stetig, so ist ein Zentralwert ein solcher Wert von 
X, der der Gleichung 


Fa) =, | (3.5.2) 


genügt. Es kann vorkommen, daß mehrere x-Werte die Beziehung (3.5.1) bzw. 
(3.5.2) erfüllen. In diesem Fall nennen wir jeden von ihnen Zentralwert. 


Beispiel 3.5.1. Die Zufallsvariable X möge die Werte 0 und 1 mit den Wahrscheinlich- 
keiten 


1 
in PX=l)=-— 
annghmen. Der Zentralwert ist der Punkt x = 1; denn es ist 
1 
PXs1l)J=PX=0+PX=1)=1> 7’ 
PX2>1) PX=1)= 2 
>1)= Sl: 
Beispiel 3.5.2. Die Zufallsvariable X sei stetig mit der durch 
0 für <<0, 
m 
fx) = J cosx für 138275: 
1} fü EL 
E — 
m >5 
gegebenen Dichte. Den Zentralwert von X erhalten wir aus den Gleichungen (3.5.2): 


a, a a, zu, 1 


[ te) de = [ coszdr = sinz er 
0 j 


und zwar ist 


T 
6 2 


2, = 


Beispiel 3.5.3. Die Zufallsvariable X möge die drei Werte = —1,, =-0undds =1 


1 1 
mit den Wahrscheinlichkeiten PX = —-1)=PX=0)= 7% PX=1= = annehmen. 
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Abb. 3.5.1 stellt die Verteilungsfunktion dieser Zufalisvariablen dar. 
Jeder Wert x aus dem Intervall [0, 1] ist hier Zentralwert, da für jedes derartige x die 
Beziehungen 
1 


a’ 


IA 


PXszn)= PXza2 


[DOY 2 


gelten. 


PlX<x} 


I—+ Abb. 3.5.1 


x 


Der Zentralwert gehört zu einer Gruppe von Parametern, die man als Quantile 
bezeichnet. 


Definition 3.5.2. Einen Wert x, der den Ungleichungen 
PX<a)2p, PXzn)21-p 0<p<i) (3.5.3) 


genügt, nennen wir Quantil p-ter Ordnung und bezeichnen ihn mit x,. 
Das Ungleichungspaar (3.5.3) ist der Doppelungleichung 


p-PX=a)<F@)<p (3.5.3) 


äquivalent. 
Hat die Zufallsvariable X eine stetige Verteilung, so ist das Quantil p-ter 
Ordnung derjenige Wert von x, der die Gleichung 


Fx)=p (3.5.4) 


erfüllt. Es kann vorkommen, daß den Ungleichungen (3.5.3) bzw. der Gleichung 
(3.5.4) mehrere Werte x genügen. In diesem Fall bezeichnen wir jeden von ihnen 
als Quantil p-ter Ordnung. 
Die Quantile und ihre Funktionen werden Lageparameter genannt. 
Beispiel 3.5.4. Die Zufallsvariable X sei normal verteilt mit der durch 
fe) = —e ? 
y2r 


1 
gegebenen Dichte. Gesucht ist der Punkt x, für den die Gleichung F(x) = Mi gilt. 
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Wir benutzen die Tafel III der Normalverteilung am Schluß des Buches und finden 


%ı 8 —1,28. 
70 


Einige einfache Funktionen der Quantile können gleichfalls als Streuungsmaße 
dienen. Ein solches Streuungsmaß stellt zum Beispiel der durch 


u 


5 (3.5.5) 


definierte Vierielwertsabstand dar. 

Wenn die Menge aller möglichen Werte einer Zufallsvariablen nach beiden 
Seiten beschränkt ist, existiert für diese Menge eine endliche obere und eine 
endliche untere Grenze. Im Fall einer beschränkten diskreten Zufallsvariablen 
“ mit endlich vielen Sprungstellen stimmt die obere bzw. die untere Grenze mit 
dem größten bzw. dem kleinsten Wert überein, den die Zufallsvariable anneh- 
men kann. er 

Ein wichtiger Lageparameter, der ebenfalls als Streuungsmaß dient, ist die 
Variationsbreite. 

Sind a bzw. b die untere bzw. obere Grenze, so wird die Variationsbreite durch 


d=b-a (3.5.6) 
definiert. 


In Beispiel 3.5.2 ist die Variationsbreite gleich = ‚ während sie im Beispiel 3.5.3 
gleich 2 ist. e 


3.6. Die Momente einer mehrdimensionalen Zufalilsvariablen 


A. Es sei (X, Y)) eine zweidimensionale Zufallsvariable. Wir betrachten die ein- 
deutige Funktion g(X, Y) der Zufallsvariablen (X, Y). 


Definition 3.6.1. Es sei (X, Y) eine diskrete Zufallsvariable mit den Sprung- 
stellen (x,, 4.) und den Sprunghöhen 2;,. Die Funktion g (x, y) seiim Riemannschen 
Sinne integrierbar. Ist die Ungleichung 

pr | ya)| <o (3.6.1) 
erfüllt, so nennen wir die Reihe 


Dir 9 (2, Yr) (3.6.1) 
i,k 


den Mittelwert E[g(X, Y)] der Zufallsvariablen g(X, Y). 
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Definition 3.6.2. Es sei (X, Y) eine stetige Zufallsvariable mit der Dichte- 
funktion f(x, y). Ist die Ungleichung 


[ [re wire ydady <o (3.6.2) 


99 oo 


erfüllt, so nennen wir das Integral 


[ [ sw.» r@ y) de dy 08.6.2) 


den Mittelwert Eig(X, Y)] der Zufallsvariablen g(X, Y). 


Definition 3.6.3. Den Mittelwert der Funktion g(X, in X! Y®. nennen 
wir Moment der Zujallsvariablen (X, Y) und schreiben 


mn = E(X!Yr): 


dabei sind 2 und n nichtnegative ganze Zahlen. Die. Summe + nr nennt man 
die Ordnung des Moments m,,. 

Ist also (X, Y) eine diskrete Zufallsvariable mit den Sprungstellen (z;, yr) 
und den Sprunghöhen 9,,, so ist nach (3.6.1) 


Mın = D Pr ya. (3.6.3) 
i,k 


Ist dagegen (X, Y) eine stetige Zufallsvariable mit der Dichte f(x, y), so er- 
halten wir nach (3.6.2) 
© © 
mn=| [=yrre y)dzdy. (3.6.4) 
= 00 


Wir erinnern daran, daß für die Existenz des Moments m;, die absolute Konver- 
genz der Reihe (3.6.3) bzw. des Integrals (3.6.4) notwendig ist. 

Es können zwei Momente erster Ordnung existieren: m,, und Mgı- Wie man 
leicht einsieht, sind dies die Mittelwerte der Randverteilungen der Zufalls- 
variablen X und Y, also 


mp =B(X), my =E(N. (3.6.5) 


Es können drei Momente zweiter Ordnung existieren: Mgg, Moa, MM, und es 
bestehen die Beziehungen 


My; = E(X2), my = E(72). (3.6.6) 


Die zentralen Momente definiert man ähnlich wie bei einer eindimensionalen 
Verteilung. Wir wollen sie mit u, bezeichnen und erhalten 


in = BLX — mo (X — Mo)": (8.6.7) 
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Insbesondere erhalten wir 


Ai = E(X — mi) = 0, (3.6.8) 


Kr = E(Y — My) = 0, 
ko = EX — mo)? = a: (3.6.9) 


Kae = ELY — Maı)?] = %- 


Dabei sind o, bzw. o, die Standardabweichungen der Zufallsvariablen X bzw. Y. 
Das zentrale Moment a,, nennen wir die Kovarianz und schreiben dafür cov (X, Y). 

Zwischen den gewöhnlichen und den zentralen Momenten bestehen ähnliche 
Beziehungen wie bei einer eindimensionalen Verteilung: 


2 
Hao = Mao — Mio» 


2 (3.6.10) 
Hoa T Mg — Mg - 
Für die Kovarianz erhalten wir 
A = EIX — mo) (X — Mon) 
=E(XY) - mo#E(N) - ms ER) + MigMgı j 
= My — MoMyı — Mg Mo + MypMyı = My — MoMpı- (8.6.11) 


B. Wir wollen uns jetzt mit dem Mittelwert der Summe und des Produkts von 
Zufallsvariablen beschäftigen. X und Y seien zwei (abhängige oder unabhängige) 
Zufallsvariable. Wir setzen die Existenz der Mittelwerte Z(X) und E(Y) voraus, 
betrachten die Zufallsvariable Z=X-+ Y und wollen den Mittelwert E(Z) 
berechnen. 

Es sei (X, Y) eine diskrete Zufallsvariable mit den Sprungstellen (x;, y,) und 
den Sprunghöhen p,. Wenn wir in 8.61) Z=X-+Y=g(X,Y) einsetzen 
und berücksichtigen, daß E({X) und Z(TY)) existieren, erhalten wir 

E(Z) = N Pau + y) = NUN Da + DU Pin 
(3.6.12) 
= um. + Napa = ER) +HEN. 
i Ä E - 


Es sei jetzt (X, Y) eine stetige Zufallsvariable mit der Dichtefunktion f(x, 9). 
In diesem Fall erhalten wir aus (3.6.2) 


Ba=| [w+ni@sdeay 
u fe Frey) dydx + fs Fre, y)dzdy (3.6.13) 


ch l@)da+ | yay)dy=ElX) HEN. 


I 
sg 8 
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Mit Hilfe vollständiger Induktion kann man die Formeln (3.6.12) und (3.6.13) 
auf endlich viele Zufallsvariable verallgemeinern. Es gilt also der 


Satz 3.6.1. Der Mittelwert einer Summe endlich vieler Zufallsvariabler ist 
gleich der Summe der Mittelwerte dieser Zujallsvariablen. 


Für das Produkt von Zufallsvariablen gilt der folgende 


Satz 3.6.2. Der Mittelwert des Produkts von endlich vielen, unabhängigen Zufalls- 
variablen ist gleich dem Produkt der Mittelwerte dieser Zufallsvariablen. 


Beweis. Zum Beweis beschränken wir uns auf ein Produkt von zwei Zufalls- 
variablen, da man den Satz durch vollständige Induktion auf eine beliebige 
Faktorenanzahl ausdehnen kann. 


Es sei (X, Y) eine diskrete Zofallsvariable mit den Mittelwerten E(X) und 
E(Y), die existieren mögen. Aus (3.6.1) erhalten wir wegen der Unabhängigkeit 
von X und Y 


E(XY) = N pa%y = DPi- Pr %iyı 
i,k i,k 
= 9.3 P.ryı = E(X)E(Y). (3.6.14) 
i k 


Analog erhalten wir, wenn (X, Y) eine stetige Zufallsvariable ist, 


x 


BAND] Saurı (2, y) dr dy = -[ Sehe f.(y) da dy 
= [ht 2) de | yhy) dy=E(X)E(N). (3.6.15) 


Damit ist Satz 3.6.2 bewiesen (wegen des Beweises des umgekehrten Satzes 


. vgl. den Anhang). 
Aus der Formel (3.6.11) für die Kovarianz und aus Satz 3.6.2 folgt, daß die 
-Kovarianz zweier Zufallsvariablen gleich Null ist. Es ist nämlich 


Ai =EXN—- ERXENTN=0. 
Daraus, daß die Kovarianz zweier Zufallsvariablen gleich Null ist, folgt aber 
noch nicht die Unabhängigkeit der Zufallsvariablen. 
Es seien X und Y zwei Zufallsvariable mit endlichen Dispersionen D?(X) 
und D2(Y). Wir betrachten die Zufallsvariable 
Z=X-+Y, 
Die Dispersion von Z ist gleich 
D(Z)=D(X+N)=E[LX + N —- [EX + NP 
= E(X®) +2E(XY) + E(Y®) — [EP —- [E(N)P — 2E(X)E(N) 
= E(X?) — [E(X)P? + EP) — [E(NP? +2E(XY)— 2E(X)E(N) 
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Schließlich erhalten wir 
D2(X + Y) = D2(X) +D2(Y)+2E(XY)— 2E(X)E(TY). (3.6.16) 
Wenn X und Y unabhängig sind, erhalten wir auf Grund von (3.6.14) 
D2(Z) = D2(X) + D2(Y). (3.6.17) 


Dieses Ergebnis kann auf die Summe endlich vieler Zufallsvariabler aus- 
gedehnt werden: 


Satz 3.6.3. Die Dispersion der Summe von endlich vielen unabhängigen Zufalls- 
variablen ist gleich der Summe der Dispersionen dieser Zufallsvariablen. 


C. Wir leiten nun die Formeln für die Momente der bedingten Verteilung einer 
der Zufallsvariablen X, Y unter der Bedingung her, daß die andere einen 
festen. Wert annimmt. 

Die Zufallsvariable (X, Y) sei diskret mit den Sprungstellen (&;, y,) und den 
Sprunghöhen p;. Wir bezeichnen mit E(Y!|X =x,) den bedingten Mittelwert 
der Zufallsvariablen Y! !=1,2,:..), wenn X =x; ist, und erhalten aus den 
Formeln (2.7.2) und (3.2.1) 


BrIX=n)= Sy, (3.6.18) 
k Pi 
Analog erhalten wir für den bedingten Mittelwert der Zufallsvariablen X! 
=1,2,...), wenn Y = y, ist, die Formel 
B(KY = y) = Dat ®e. (3.6.19) 
i Pr 


Es sei (X, Y) eine stetige Zufallsvariable mit der Dichtefunktion (&, y). Aus 
den Formeln (2.7.6) und (3.2.2) ergibt sich 


fo y) | 
EYX=r)= ı ———d 3.6.20 
(= Ss a) 93 (3.6.20) 
und ebenso 
ra I, Y) : . 
EX!|Y=y)= { de. 3.6.21 
a “ 2N, fr.) . 


Die Formeln (3.6.18) bis (3.6.21) sind selbstverständlich nur dann sinnvoll, 
wenn die betrachteten Momente existieren. 

Die bedingten Momente der einen Zufallsvariablen sind konstante Größen, 
sofern die Werte der anderen Zufallsvariablen festgelegt sind. So ist zum Beispiel 
für ein festes x, das Moment E(Y!|X =x,) konstant. Aber x, ist ein Wert der 
Zufallsvariablen X; wir können daher E(Y!|x) als Zufallsvariable auffassen, die 
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die Werte E(Y!|X = x;,) mit der Wahrscheinlichkeit 9; © =1,2,...) annehmen. 
Berücksichtigen wir die Formel (3.6.18), so finden wir für eine beliebige Teilmenge 
S der Sprungstellen x; der Zufallsvariablen X die Gleichung (vgl. 2.7.C) 


E(YIXeE8) SEHEN = yı|X € 8) 


= 2u( 2 Pu Z,P«) 


mies Es 


= 39. Yapın Pi 


EI] k Pi [mes 


— EIB(T!IX =a)|Xe€ 8]. (3.6.22) 


Nehmen wir insbesondere für 8 die Menge aller Sprungstellen x; der Zufalls- 
variablen X, so erhalten wir 


Er) = ZEypR = = Zp.R (Y!IX =x,) = E[E(Y'|e)]. (3.6.22) 


Ähnlich erhalten wir im Fall einer stetigen Zufallsvariablen aus der Formel 
(3.6.20) für eine beliebige Borels@he Menge 8 auf der x-Achse, für die P(X € S)> 0 
gilt, die Gleichung 


EiY!|XeS8) = [yelte, y)dxdy/P(X € S) 
S 


00 


= (hie) [ [vr ayazıpız es 
S 0 1 


ar E(Y!|IX =x)de 
P(Xe€8) 
5 


— B[E(T'IX =a)|X € 8]. (3.6.23) 


Setzen wir 8 = (— 00, oo), so ergibt sich 


Ery=[ [vr y)dedy 


Fe = o)de 


= EIE(T!|e)]. (3.6.23) 
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Die Formeln (3.6.22) und (3.6.23) lassen sich auch durch die eine Formel 
B(Y'|XCS)=EIR(YIX=a)|Xe 8]. 8.6.24) 
darstellen, während wir (3.6.22’) und (3.6.23) durch 
Er!) = B[IE(Y'|e)] (3.6.24) 


darstellen können. 

Die gewonnenen Formeln eröffnen uns einen neuen Zugang zum Problem der 
bedingten Wahrscheinlichkeit. Es sei # die Menge der Elementarereignisse e 
und Z ein Borelscher Körper zufälliger Ereignisse, die Untermengen von #& sind. 
Ferner sei A€ Z ein festes zufälliges Ereignis. Nun definieren wir eine Zufalls- 
variable Y folgendermaßen: 


yo 1 Fi ecA4, 
0 für edA4; 


es ist somit P(Y =1) = P(A). Sodann sei X eine beliebige andere, in derselben 
Menge # der Elementarereignisse definierte Zufallsvariable mit der Eigenschaft, 
daß die rechte Seite von (3.6.24) existiert. Die nn (3.6.24) bzw. (3.6.24’) 
erhalten nunmehr die Form 


P(A|IXeE 8) = E[P(A|X =a)|X € 8] (3.6.24) 
bzw. i 
P(4)=EIP(Alal, 8.6.24”) 


und es ist daher P(A!x) eine Zufallsvariable. 

Man beachte, daß (3.6.24), (3.6.24'), (3.6.24'’) und (3.6.24°) unter der Voraus- 
setzung hergeleitet wurden, daß die Zufallsvariable (X, Y) entweder diskret oder 
stetig ist und daß die in 2.7 formulierten zusätzlichen Bedingungen erfüllt sind. 
Im allgemeinen Fall jedoch dienen die Gleichungen (3.6.24) bzw. (3.6.24) (vgl. 
Anhang) als Definitionen des bedingten Mittelwertes bzw. der bedingten Wahr- 
scheinlichkeit. Diese Definitionen verdanken wir KOLMOGoROFF [7], der zugleich 
gezeigt hat, daß, falls Z(Y!) existiert, die Gleichung (3.6.24) die Zufallsvariable 
E(Y'|x) bis auf Äquivalenz eindeutig bestimmt, d. h., genügt irgendeine andere 
Zufallsvariable U, anstelle von E(Y’|x) in (3.6.24) eingesetzt, dieser Gleichung, 
so gilt 

PIU-E(Ylke)=0=1. 


Insbesondere bestimmt somit die Gleichung (3.6.24) bis auf Äquivalenz ein- 
deutig die bedingte Wahrscheinlichkeit P(A |). 

Eine weitere Entwicklung dieser Gedankengänge findet der Leser in der 
Monographie von Doog [5]. 
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D. Bis jetzt haben wir uns in 3.6 auf zweidimensionale Zufalisvariable beschränkt; 
die Ausdehnung der eingeführten Begriffe auf mehr als zwei Dimensionen bereitet 
jedoch keine Schwierigkeiten. Wir wollen hier nur noch einige Bemerkungen über 
den bedingten Mittelwert in m-dimensionalen (m > 2) Verteilungen machen. 

Wir betrachten die stetige Zufallsvariable (X, X, ..., X„) und nehmen an, 
daß die Dichtefunktion f(x, &, ..., 2.) überall stetig und die Dichtefunktion der 
Randverteilung 


[ta 2 u. m) OR = Il». , Cm) 


der Zufallsvariablen (X,,..., X„) überall stetig und positiv ist. Wir können 
dann die bedingten Momente /-ter ERRUNE =1,2,3,.) 


© 


Dee [al Man an sam) (8.6.25) 
9 (%», ...; nm) 


0 


betrachten. 

Ebenso kann man auch die bedingten Momente der übrigen Zufallsvariablen 
und die mehrdimensionalen bedingten Momente irgendeiner Gruppe von Zufalls- 
variablen bilden. 

Für diskrete Zufallsvariable ist der Gedankengang ganz analog, 


E. Falls in einer zweidimensionalen Verteilung die Standardabweichungen 
c, und o, existieren und von Null verschieden sind, kann man einen sehr wichtigen 
Parameter definieren, der die zweidimensionale Verteilung charakterisiert, 
nämlich den Korrelationskoeffizienten o: 


__ BR) mo) _ _ Mn 
VBLX — mi)®] VEIT — ma) 9102 
Eine grundlegende Eigenschaft des Korrelationskoeffizienten o gibt der'folgende 
Satz an. 


Satz 3.6.4. Der durch (3.6.26) definierte Korrelationskoeffizient o erfüllt die 
Ungleichung 


(3.6.26) 


Jod, (3.6.27) 


Beweis. Wir betrachten für beliebige reelle i und u den nichtnegativen Aus- 
druck 
ET — mo) + ul — ma )?} 
= PELR — my)?] + 2tuB[(X — mio) (F — Ma)] + WELT — My)? 
= 202 + 2tumı + Wo}. (3.6.28) 
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Da die linke Seite des Ausdrucks (3.6.28) niemals negativ ist, müssen die Un- 
gleichungen 


M-ARZS0 oda —0,, ZZ 010, 
gelten, also 


ee, 
010g 


Nach der Definition des Korrelationskoeffizienten folgt daraus unmittelbar die 
Ungleichung (3.6.27). 

Sind die Zufallsvariablen X und Y unabhängig, so ist u, =, also auch 
e=0. Wie oben schon erwähnt wurde, ist die Umkehrung dieses Satzes nicht 
richtig. Wenn og = 0 ist, so sagen wir, daß die Zufallsvariablen unkorreliert sind 
(zum Unterschied von „unabhängig“). 

Wie man bemerkt, ist Satz 3.6.3 auch dann richtig, wenn je zwei der dort 
vorkommenden Zufallsvariablen unkorreliert sind. 

Eine Antwort auf die Frage, was es bedeutet, wenn der Korrelationskoeffizient 
0? gleich 1 ist, gibt der folgende Satz: 


Satz 3.6.5. Die Beziehung 
PY=coeX+b=1 (3.6.29) 


gilt genau dann, wenn 0? =1 ist. 

Ehe wir diesen Satz beweisen, wollen wir ihn interpretieren. Nach diesem 
Satz ist die Wahrscheinlichkeit dafür, daß die Zufallsvariable (X, Y) Werte 
annimmt, die auf einer Geraden der x, y-Ebene liegen, gleich Eins, wenn  =1 
ist. Würden wir diese Gerade als Koordinatenachse wählen, so hätten wir es mit 
einer eindimensionalen Zufallsvariablen zu tun. Man veranschaulicht diesen 
Tatbestand, indem man sagt, die ganze „Wahrscheinlichkeitsmasse‘‘ liege auf 
einer Geraden. 


Beweis. Wir nehmen an, die Beziehung (3.6.29) sei erfüllt, es sei also 
PY=zaX+b=0. 
Nach (3.6.24) erhalten wir 
My =E(Y) 
=P(Y=aX-+b)E(Y|Y=aX+b) 
+P(Y+zaX+b)E(YIY+zaX-+b) 
= E(aX +b) =amu, +; 
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o = EI(Y — ma)?] 
=P(Y=aX +b)EIY — ma)” |Y =aX +5] 
+P(Y +aX +5) BY — m |Y +aX +] 
= EliaX +5 — my )?] = Ela? (X — myo)?] 
= E[(X — my)?] = a?o, 


Analog erhalten wir 4, = @0?. Aus diesen Gleichungen folgt 0? = 1. 
Es sei nun 0? = 1. Aus der Definition des Korrelationskoeffizienten erhalten 
wir 
Brooe — Kir = 0: £ 
Die quadratische Form (3.6.28) nimmt also den Wert Null für ein gewisses 
Zahlenpaar = 1, u = u, an, wobei f, und %, nicht gleichzeitig Null sind. Für 
diese Werte t,, u, ist also 


E{lio (X — my) + WwlF — ma} = 0. 
Diese Gleichung ist nur dann erfüllt, wenn 
Pi X — m) tw Mm) =01=-1 
gilt. Wenn wir u, == 0 annehmen, dann folgt daraus 
Plr= 2x 4 Puteh mul) 2 
Un Us 


Der Satz 3.6.5 ist.also vollständig bewiesen. 

Aus diesem Satz folgt, daß der Fall 0? =1 den größten Gegensatz zur Un- 
abhängigkeit darstellt, also der Fall extremer Abhängigkeit ist. Ist e =1, dann 
ist die Änderungsriehtung der beiden Veränderlichen dieselbe, d.h., größeren 
Werten der einen Veränderlichen entsprechen auch größere Werte der anderen und 
umgekehrt. Ist dagegen e = —1, so ist die Änderungsrichtung entgegengesetzt. 


Beispiel 3.6.1. Die Zufallsvariablen X und Y haben die gemeinsame Dichte 
_ a —2eut2y? 


1 
Ener 5 


Dieser Ausdruck ist eine Wahrscheinlichkeitsdichte; die Funktion f(x, y) ist nämlich positiv, 
und außerdem ist 


x oo 
) i _ eat ; 
Jr et [« de dy 
27 J 
[> +2 


-80.—0 — 00 — 0 


8 Fisz 
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Die Verteilung der betrachteten Zufallsvariablen ist ein Spezialfall der zweidimensionalen 
Normalverteilung (siehe 5.11). 


Wir berechnen die Momente erster und zweiter Ordnung: 


o © " © © 
1 _ 14 _ an! a 
m. | [Hrewarav- — I 2 —— f* 2 dedy 
y2r y?x 
00 —o0 .. x 


1 a! 2 1 a 
Ta e _— [ve (v N ara I 3° de=0 
'm Te TE 
-o - 00 
Also erhalten wir 
Ir -!ı ff - a 
mon, [1 m [m ® dady 
vs m 
ı f.-? 
= 7 fr td, 
27 
© 
[>,°3 oo 
1 21 („2 
Ko = Ma = 2ym fr 4 Yr f (v SR 
Ts k a 


1 
8 


1 f.-2 ı fe 
Ko Me = — Ye u fe 2 dedy 
. ul Y2r 
Ei f 


Daraus bekommen wir als Korrelationskoeffizienten 


BR. 


To, y2 


3.6. Die Momente einer mehrdimensionalen Zufallsvariablen 115 


Neben dem Korrelationskoeffizienten gibt es viele andere Maße für die Ab- 
hängigkeit zwischen zwei Zufallsvariablen. Ausführliche Informationen hierüber 
findet man in den Büchern von EZEkIeL [1] und M. G. Kewpaut [1]. Unter den 
neueren Arbeiten auf diesem Gebiet nennen wir die von GEBELEIN [1], HırscH- 
FELD [1] sowie Rünvı [8], [9]. In den letzten beiden Arbeiten werden einige 
wichtige Abhängigkeitsmaße zwischen zwei Zufallsvariablen miteinander ver- 
glichen. 


F. Wir wollen uns jetzt den n-dimensionalen Zufallsvariablen (X,,X,,..., X,) 
zuwenden. Wir setzen voraus, daß die Dispersionen 0 @ =1,2,...,n) der 
Zufallsvariablen X, existieren und positiv sind und daß die Kovarianzen aller 
Paare von Zufallsvariablen existieren. Mit A;, bzw. o;, bezeichnen wir die Ko- 
varianz bzw. den Korrelationskoeffizienten der Zufallsvariablen X, und X, 
also ist A,; = 0}. 

Die symmetrische Matrix 


Aıı Az ++: Am 
Mm-—Hhfsı A --- Aan , (3.6.30) 
Anı Ang se Ann 


deren Elemente die Momente A,, zweiter Ordnung sind, nennen wir Momenten- 
matrix. Mit | M | bezeichnen wir die Determinante der Matrix M. 

Eine Verallgemeinerung des Satzes 3.6.5 auf n Zufallsvariable wäre ein Satz, 
der zu entscheiden erlaubt, wann zwischen den Zufallsvariablen X,, X, ..., Xn 
irgendwelche linearen Beziehungen bestehen. Das gewünschte Kriterium gibt 
der folgende Satz. 


Satz 3.6.6. Haben die Zufallsvariablen X,, ...; X, endliche Dispersionen und 
Kovarianzen, so ist die Bedingung 


IM|=0 


notwendig und hinreichend dafür, daß mit der Wahrscheinlichkeit Eins unter 
den Zufallsvariablen mindestens eine lineare Beziehung besteht. 

Der Beweis von Satz 3.6.6 verläuft ebenso wie der des Satzes 3.6.5, nur mit 
dem Unterschied, daß hier die niehtnegativ definite quadratische Form 


n 2 n j 

E I t; (X: ba 0] u P3i Artile > 0 (3.6.31) 

i-1 ük=1 

an die Stelle des Ausdrucks (3.6.28) tritt. 
Die Interpretation ist ähnlich wie bei Satz 3.6.5. Ist nämlich |M | = 0, dann 

liegt die ganze „Wahrscheinlichkeitsmasse“ in einer Hyperebene von kleinerer 

Dimension als r. 


8*+ 
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G. Im Zusammenhang mit dem Satz 3.6.6 geben wir die folgende Definition: 


Definition 3.6.4. Genügen die Komponenten X, ..., X, eines Zufallsvektors 
(X, ...,X,) wenigstens einer linearen Beziehung mit der Wahrscheinlichkeit 1, 
so nennt man die Verteilung von (X,,...., X,) ausgeartet. 

Ist die Determinante |M | #0, so ist die Verteilung von (X,,...,X,) nicht 
ausgeartel. 


Definition 3.6.5. Die Determinante |M| nennen wir die veraligemeinerte 
Varianz. 

Um diese Bezeichnung zu begründen, zeigen wir, daß |M| als Streuungsmaß 
dienen kann. Zunächst stellen wir fest, daß die quadratische Form (3.6.31) 
wegen |M| #0 nicht negativ ist. Ferner sehen wir, daß wegen A; = A. die 
Matrix M symmetrisch und positiv definit ist. Hieraus geht hervor, daß 
|M| = 01 --- 0, ist. Die Determinante |M| hat somit ihren größten Wert für 
Ag =0 (ik), d.h. für den Fall, daß die unabhängigen Variablen X,,..., X, 
nicht korreliert sind. Andererseits hat das Produkt 07-0} einen umso kleineren 
. Wert, je kleiner die o; und damit je weniger gestreut die Randverteilungen der 
Variablen X, sind. Das genannte Produkt ist aber die obere Grenze der ver- 
allgemeinerten Varianz. In dem äußersten Fall, daß wenigstens eines der of 
gegen Null strebt, artet wegen Satz 3.6.6 die Verteilung von (X,,..., X,) aus, 
d. h., sie wird zur Verteilung einer Zufallsvariablen von weniger als a Dimensionen. 
Es ist durchaus natürlich anzunehmen, daß eine solche Verteilung in einem n- 
dimensionalen Raum äußerst konzentriert erscheint. 

Der Begriff der verallgemeinerten Varianz wurde von Wırks [1] eingeführt. 

Wir betrachten nun die Matrix R der Korrelationskoeffizienten o;, und nehmen 
dabeio,; =1lan: 


nern. 


Enı On2 «1 
Wegen 04 = 2 erhalten wir für die Determinanten |R| und |M]| die Be- 
ziehung on 
M=d4--%|£R|. (3.6.34) 


Die Matrix R ist ebenfalls symmetrisch und positiv definit, und ihre Deter- 
minante genügt der Ungleichung |R| = 1. Ihren größten Wert 1 nimmt die 
Determinante |R| an, wenn sämtliche Korrelationskoeffizienten 0, = 0 sind. 
Ihren Minimalwert 0 nimmt sie an, wenn wenigstens einer ihrer Korrelations- 
koeffizienten den Wert 1 annimmt und die Verteilung somit ausgeartet ist. 
Hieraus geht hervor, daß der Wert der Determinante |R| als Maß der Aus- 
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artung der Verteilung des Vektors (X,,..., X,) dienen kann. Ein solches Maß 
hat Frison [1] durch die folgende Definition eingeführt: 


Definition 3.6.6. Der Ausdruck Y| R| heißt Dispersionskoeffizient. 


3.7. Die Regression erster Art 


A. Es sei (X, Y) eine zweidimensionale diskrete Zufallsvariable mit den Sprung- 
stellen (x;, 4.) und den Sprunghöhen 9;,, während durch p;. bzw. p., wie bisher 
die Bandverteilungswahrscheinlichkeiten der Zufallsvariablen X bzw. Y be- 
zeichnet werden. 

Wir betrachten die bedingten Mittelwerte von X und Y, die wir mit m, (y;) 
und my(x;) bezeichnen wollen und die wir aus den Formeln (3.6.18) und (3.6.19) 
erhalten, wenn wir /=1 setzen: 


m(y) = E(X1IY = yı) = um, | 
ei (3.7.1) 
m;(&) =E(YIX =x,) = Inst. 


Auf diese Weise erhalten wir zwei Punktmengen der x, y-Ebene. Die erste 
Menge besteht aus Punkten mit den Koordinaten 


z=m(Yy) Y= Yen. (3.7.2) 
die zweite aus Punkten mit den Koordinaten 
=, yamlı). (3.7.3) 


Nun sei (X, Y) eine zweidimensionale stetige Zufallsvariable mit der Dichte 
f(x, y) und den Randdichten f(x) und f,(y). Damit die bedingten Verteilungen 
der Veränderlichen X und Y definiert sind, nehmen wir an, daß die Dichte- 

- funktionen den in 2.7 besprochenen zusätzlichen Bedingungen genügen. Die be- 
dingten Mittelwerte m,(y) und m,(x) erhalten wir aus den Formeln (3.6.20) und 
(3.6.21): 


m) =RX|Y=y)= eng 2 
2 


mi) =BiIX-0)- [vet 


(8.7.1) 
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Wiederum ergeben sich zwei Punktmengen der x, y-Ebene, die eine mit den 
Koordinaten 


z=m,(y) und y, (3.7.4) 


die andere mit 
x und y=ms,(k). (3.7.5) 


Definition 3.7.1. Die Punktmenge der x, y-Ebene mit den Koordinaten 
(3.7.2) oder (3.7.4) heißt Regressionskurve der Zufallsvariablen X bezüglich Y, 
die Punktmenge mit den Koordinaten (3.7. =) oder (3.7.5) heißt Regressionskurve 
von Y bezüglich X. 


Aus der Definition folgt, daß auf der Regressionskurve von X bezüglich Y 
die bedingten Mittelwerte der Zufallsvariablen X liegen, wenn Y der Reihe nach 
alle möglichen Werte annimmt. Ebenso ist es bei der Regressionskurve von Y 
bezüglich X. Im allgemeinen überdecken sich die beiden Regressionskurven nicht. 

Liegen alle Punkte der Regressionskurve auf einer Geraden, so sprechen wir 
von einer geradlinigen Regression. 

Besteht zwischen den beiden Zufallsvariablen X und Y eine lineare Beziehung 
Y=aX-+b, dann nimmt die Zufallsvariable (X, Y) nur Werte auf dieser 
Geraden an. Daraus folgt, daß die Mittelwerte auf der Geraden liegen und daß 
also auch beide Regressionskurven mit ihr zusammenfallen. 


Sind die Zufallsvariablen X und Y unabhängig, so ist 
m;(X)=E(YX=2)=E(T), 
m(y)=EX|Y=y)=EiR). 


Der bedingte Mittelwert m,(x) hängt dann nicht von x ab. Die Regressionskurve 
der Zufallsvariablen Y bezüglich X liegt also auf einer zur x-Achse parallelen 
Geraden; ebenso liegt im Fall unabhängiger Zufallsvariabler die Regressionskurve . 
von.X bezüglich Y auf einer Parallelen zur y-Achse. Diese beiden Geraden schnei- 
den sich in einem Punkt mit den Koordinaten (m,, m,). 

Die hier besprochene Regression nennen wir im Unterschied zu einem’ anderen 
Begriff der Regression, den wir in 3.8 behandeln wollen, Regression erster Art. 


Beispiel 3.7.1. Die Zufallsvariable (X, Y) kann die Wertepaare (x,, yı) (k,T = 1, 2,3, 4, 5) 
annehmen. Dabei ist 


mel =, 3,4, By Äh, 3, = %=55 


die Wahrscheinlichkeiten p,; der einzelnen Paare (x;, y,) sind in Tabelle 3.7.1 angegeben. 

Außer den Werten 9, ist in der letzten rechten Spalte dieser Tabelle die Randverteilung 
der Zufallsvariablen Y und in der untersten Zeile die Randverteilung der Zufallsvariablen X 
angegeben. 
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Tabelle 3.7.1. Die Wahrscheinlichkeiten Pyı 


% Rand- 
1 2 3 4 5 verteilung 
Yı von F 
n Js L = Lt I 2 
12 24 24 30 5 
2 1 LI 4 u Lt ns 
24 24 24 24 30 5 
3 E3 4 Lt = At E 
12 24 24 30 5 
4 e er I E3 4 I 
12 24 24 30 5 
5 a L Lt 2 ee I 
24 24 24 24 30 5 
a ee al IE 
ar 3 2: 6 6 6 


In Tabelle 3.7.2 sind die bedingten Verteilungen der Zufallsvariablen Y unter der Be- 
dingung X = x; (k=1,...,5) und in Tabelle 3.7.3 die bedingten Verteilungen der Zufalis- 
variablen X unter der Bedingung Y = yı (= 1,..., 5) angegeben. 


Tabelle 3.7.2.. Tabelle 3.7.3. 

x %p ins- 
R 1 2 3 4 5 yı . 2 3 4 5 Zesamnt 
Ber le ker el 
4 4 4 j 12 | 24 24 | 6 
ee ee ee]. 
8 4 4 4 5 24 | 24 | 24 | 24| 6 

B 
3 1 1 1 3 5 5 5 1 
4 4 4 5 12 | 24 | 24 6 
4 ı1/1|_ı 17 ı2[|4 FRE Be 30 Rem E20 0: ee 
4 4 4 5 12 24124| 6 
Ele ee ; 
4 4 4 5 24 | 24 | 24 | 2416 
ins- 
gesamt a 1 1 ! ı 
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Wir berechnen die Mittelwerte der einen Zufallsvariablen, wenn die andere einen festen 
Wert annimmt. Es ist 


1; 
€ 8 


N 1 
BIIIX=ND- ER EZE 
(r ) +4 + 2 
3 1 
BNIX=9=2,, BINIX=3)=3,, EIYIX=9=3, BrIX=5)-3 


und 


EX|Y=23)= 2 i+ 2 2+ & 3+ 2 +. en 
IT 24, 24 24 24 6 m 


1 7 17 
EX|Y=1)=2-, EX|Y=3)=2—, EX|Y=)=2-—, 
<l 2 ee | er 


11 
EX|)Y=5)=-2—. 
12 
Auf diese Weise erhalten wir zwei Punktmengen der x,y-Ebene. Die erste Menge besteht 
aus Punkten mit den Koordinaten 
Lu 7 TE y=E(Y|X=x,) (k=1,2,3,4, 5) 
und die zweite aus Punkten mit den Koordinaten 


y-yn x=E(X|Y=y) e (i=1,2,3,4,5). 


Die erste Punktmenge ist die Regressionskurve der Zufallsvariablen Y bezüglich X, die 
zweite die Regressionskurve von X bezüglich Y. 


Beispiel 3.7.2. Wir wollen die Regressionskurven für die in Beispiel 3.6.1 angegebene 
zweidimensionale Normalverteilung berechnen. 
Wir bestimmen dazu zunächst die Randverteilungen 


2 et 1° x® 


: 1 
nei= [Hanau [ze z as %, 
TE 


oo 


oo oo 
- 1 _ Bey tt i _® 
10 = [Htonae= [ze 2 da=-—e 2. 
00 0 


Nach (2.7.6) erhalten wir daraus die bedingten Dichten 


Ile) = a v3) 
_ m 


el) = —e . ? 
2n 
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und hieraus 


Die Regressionskurven sind hier also Geraden. Später werden wir sehen, daß für jede 
Normalverteilung die Regressionskurven Geraden sind. 


B. Die Regressionskurven erster Art haben eine äußerst; wichtige Minimaleigen- 
schaft. Die Regressionskurve von Y bezüglich X erfüllt nämlich die Relation 


E{[Y — m,(X)]} = min. (3.7.6) 


Mit anderen Worten: Die mittlere quadratische Abweichung der Zufallsvariablen 
Y von der Funktion v(X‘) ist am kleinsten, wenn v(X) (mit der Wahrscheinlich- 
keit 1) gleich m, (X) ist. 

Wir beweisen die Beziehung (3.7.6) für den Fall, daß (X, Y) eine zweidimensio- 
nale stetige Zufallsvariable mit der Dichte f(x, y) ist. Dann ist 


BIT - u} = f[ [Iy- wußte, y)dedy 
= RL h(@) J Iy — ua) f(yla) dy de. (8.7.7) 


Aus (3.2.12) folgt, daß die rechte Seite von (3.7.7) ihr Minimum für u(&) = m, (x) 
annimmt. 

Für diskrete Zufallsvariable ist der Beweis analog. 

Eibenso genügt die Regressionskurve von X bezüglich Y der Relation 


EIX—- m (NM%=min (3.7.8) 


C. Für n-dimensionale (n > 2) Zufallsvariable kann man den Begriff einer Re- 
gressionsfläche erster Art einführen. Wir beschränken uns auf stetige Zufalls- 
variable. Es sei also f(x, %,-..,%,) die Dichtefunktion der Zufallsvariablen 
(X, X2 ..., X,). Das bedingte Moment, das durch die Formel (3.6.25) definiert 
wird, möge für 1=1 existieren. Wir wollen es mit m, (&,, ..., %,) bezeichnen. 
Es ist also 


My...) = HK = iu. ., = 9) 


oo r 
f fe, Kane, %n) da, 
x 


f Hy % ..., %) dx, 
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Definition 3.7.2. Die Punktmenge des n-dimensionalen (2, & +-- &u)- 
Raumes mit den Koordinaten 


= M(&y ..., Cm) %y ++, In 


heißt Regressionsfläche erster Art der Zufallsvariablen X, bezüglich der Zufalls- 
variablen X ..., Xn- 

Ebenso kann man auch die Regressionsflächen der übrigen Zufallsvariablen 
definieren. 

Die Regressionsflächen erster Art besitzen eine analoge Minimaleigenschaft wie 
die Regressionskurven. Es gilt nämlich die Formel 


E{[X, — m, (X, ..., X,)P} = min, (3.7.9) 


d.h., die mittlere quadratische Abweichung der Zufallsvariablen X, von einer 
Funktion v(X,,...., X,) erreicht dann ihren kleinsten Wert, wenn die Funktion 
uXs,..., X„) (mit der Wahrscheinlichkeit 1) gleich 


m (X... Xn) 
ist. 


3.8. Die Regression zweiter Art 


A. Wir haben die Regressionskurve erster Art von Y bezüglich X als Punktmenge 
der x, y-Ebene mit den Koordinaten x, m, (x) definiert, wobei m, (x) der Mittelwert 
der Zufallsvariablen Y unter der Bedingung X =x ist. Analog wurde die Re- 
gressionskurve der Zufallsvariablen X bezüglich Y definiert. Dabei zeigte es sich, 
daß die Regressionskurven den Bedingungen (3.7.6) bzw. (3.7.8) genügen. Diese 
Kurven liegen im allgemeinen nicht auf einer Geraden. Bei praktischen Problemen 
muß man aber manchmal diejenige Gerade bestimmen, von welcher (unter allen 
Geraden in der x, y-Ebene) die mittlere quadratische Abweichung der Zufalls- 
variablen Y am kleinsten ist. Hat also die Gleichung dieser Geraden die Form 
y= ax + ß, dann soll die Bedingung 


Ei[Y — («X + pP) = min (3.8.1) 
erfüllt sein. 


Definition 3.8.1. Eine Gerade, die die in (3.8.1) geforderte Eigenschaft besitzt, 
heißt Regressionsgerade zweiter Art der Zufallsvariablen Y bezüglich X. 
‘ Wir wollen die Koeffizienten « und ß dieser Geraden bestimmen. Wenn wir die 
Bezeichnungen 


E(X)=mo E(Y) = Ma; 
= Vu = VELX — m]; 


0 = Yan = Ver — My); 
An = EX — mu)(Y — Moi)] 
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benutzen, so erhalten wir 
E{[Y — («X + PP} 
= E{[Y — my — (X — Mo) F Myı — aM — PR} 
= ELY — m)’ + ®EL(X — m0)?] 
— 2%E[(X — mio) (X — Moy)] + (Mor — &Mıo — B)? 
= Hgg + ago — 2 + (Mor — Mo — BIP. (3.8.2) 
Um das Minimum des Ausdrucks (3.8.2) zu bestimmen, differenzieren wir ihn 


nach « und nach $ und setzen die Ableitungen gleich Null. Dann erhalten wir die 
beiden Gleichungen 


2% ligo — 2 — 2MolMgı — Ma — P)=d, 


(3.8.3) 

My — Mm — Pd. : 
Die Auflösung dieses Gleichungssystems ergibt 

“= en: = Mo — &My- 

ao 
Wenn wir die Bezeichnung go = fi für den Korrelationskoeffizienten be- 
: 6105 

nutzen, erhalten wir 

6 lu 

“=0-, Beam —eo— Mm: (3.8.4) 


Die Koeffizienten « bzw. 8 werden wir in Zukunft mit &,, bzw. f,, bezeichnen. 
Analog erhält man für die Koeffizienten der Regressionsgeraden von X bezüg- 
lich Y 
6 6 
ea, Pre = Mo — @ — My: (3.8.5) 
0 0 
Die Größe a,, heißt Regressionskoeffizient der Zufallsvariablen Y bezüglich X 
und die Größe a,, Regressionskoeffizient von X bezüglich Y. 
Die Gleichung der Begressionsgeraden von Y bezüglich X kann man also in 
der Form 


© 
Y-Mı—=_ — (8 — my) (8.8.6) 
o, 
schreiben, während die Gleichung der Regressionsgeraden von X bezüglich Y 
die Gestalt 


lc 
mn N) (3.8.7) 
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hat. Aus den Gleichungen (3.8.6) und (3.8.7) folgt, daß im Fall &® =1 die 
Regressionsgeraden zusammenfallen. 
Leicht lassen sich die Beziehungen 


E(Y — o1X — Pa) = 0, 
EiIY — (X + BP} =g(1- 0) 


herleiten. Die Größe (1 — e?) ist die Dispersion der Zufallsvariablen 


(3.8.8) 


Y—oyX— Pyı 


und gleichzeitig die minimale mittlere quadratische Abweichung der Zufalls- 
variablen Y von einer Geraden der x, y-Ebene. 


Eine einfache Rechnung führt zu der Gleichung 


EX — mo (7 X — Ba)l=0; ö (3.8.9) 
also sind der ‚Rest‘ 
Y—oı&— Pa 


und die Zufallsvariable X nicht korreliert. 
Ebenso gelten die Beziehungen 


EX — 0X — Bo) = 0; 
ER- + e), (3.8.10) 
EIYT - my) X — 0:7 — Aa)l=0. 


Die Größen 01 (1 — 0?) und o, (1 — 0°) nennt man Restdispersionen. 


Beispiel 3.8.1. Wir wollen die Regressionsgeraden zweiter Art für das Beispiel 3.7.1 
bestimmen. Zu diesem Zweck berechnen wir aus Tabelle 3.7.1 die Größen 


me. = EX) = 25, my =E(T)=3, 
0, = YD2(X) = 1,49, = YD(T)= 1A, 0 = 0,06. 
Die Gleichung der Regressionsgeraden von Y bezüglich X lautet hier wegen (3.8.6) 
y— 3 = 0,056 (& — 23). (3.8.11) 
Die Berge von X bezüglich Y hat wegen (3.8.7) die Gleichung 
y—3 = 15,7(x — 23). 


In Abb. 3.8.1 sind die durch die Formel: (3.8.11) bestimmten Regressionsgeraden und 
die Regressionskurve von Y bezüglich X und in Abb. 3.8.2 die Regressionsgerade und die 
Regressionskurve von X bezüglich Y dargestellt, 
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Beispiel 3.8.2. Es sind die Gleichungen der Regressionsgeraden für die zweidimensionale 
Normalverteilung des Beispiels 3.6.1 zu bestimmen. 
Für dieses Beispiel hatten wir schon die Werte 


i 1 
NM my—=d, = Y2, 5-1, n 
berechnet. Setzen wir sie in die Formeln (3.8.4) und (3.8.5) ein, so erhalten wir 


1 
ee 


FR Pa = 0, %a=1, Ba. 


Die Gleichungen der Regressionsgeraden lauten also 


1 
=—ız, 


2 
y=t. 


Wie wir sehen, sind hier die Regressionsgeraden zweiter Art mit den Regressions- 
kurven erster Art identisch (vgl. Beispiel 3.7.2). Diese Eigenschaft besitzt jede 
zweidimensionale Normalverteilung. 


\ 


Abb. 3.8.1 Abb, 3.8.2 


B. Die Verallgemeinerung des Begriffs der Regressionsgeraden zweiter Art auf n- 
dimensionale Zufallsvariable (n > 2) ist der Begriff der Begressionshyperebene 
zweiter Art. 

Es sei (X,,X,...,X,) eine n-dimensionale Zufallsvariable und E(X,) =0 
=1,2,...,n). Diese Voraussetzung bedeutet keine wesentliche Beschränkung 
der Allgemeinheit. Wäre sie nämlich nicht erfüllt, so könnten wir die Zufalls- 
variablen X, — E(X,) betrachten. Wir haben gezeigt, daß die Regressionsfläche 
erster Art der Zufallsvariablen X, bezüglich der übrigen Veränderlichen der Be- 
dingung (3.7.9) genügt. Nicht immer ist aber die Regressionsfläche erster Art eine 
Hyperebene. 


Definition 3.8.2. Die Hyperebene 
X = ont ads tt nf, (3.8.12) 
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die der Bedingung 
EX, — O2 Ka — 1 Xg — 1 8 X)?] = min (3.8.13) 


genügt, nennt man Regressionshyperebene zweiter Art der Zufallsvariablen X, 
bezüglich der Zufallsvariablen X, X ..., An: 

Wir nehmen an, daß die Determinante der durch die Formel (3.6.30) definierten 
Matrix M von Null verschieden ist. Wäre das nicht der Fall, so würde nach Satz 
3.6.6 zwischen den Zufallsvariablen X,, X, ..., X, mindestens eine lineare 
Beziehung bestehen, und die durch diese lineare Beziehung bestimmte Hyper- 
ebene würde den Bedingungen (3.8.13) genügen. 

Wir schreiben (3.8.13) in der Form 


n n 
2 tn > ie 
+ 3 Ara — 2% Auaı = min, 
,k=2 i=2 


differenzieren diesen Ausdruck-.nach den &,; und erhalten das lineare Gleichungs- 
system 


Agp&ıg + Aygaız ++ Agnkın — Aa» 


Agg&ıa + Ags&ıa "+ Asndın = Ays» (3.8.14) 


Pa er Br Ser Ser BEE Er SE Er SE Er 


Ang&ıg + Anskız ++ Annın = An: 


Nach Voraussetzung ist die Determinante |M| +0; die symmetrische quadra- 
tische Form (3.6.31) ist folglich positiv definit. Daraus folgt, daß alle Haupt- 
minoren der Determinante |M| positiv sind.!) Das Gleichungssystem (3.8.14) 
ist also eindeutig lösbar, und wir erhalten 


IM;:| 
IM 


Xu = 


=2,...,n), (3.8.15) 


wobei |M;;| und |M,,| die zu A, bzw. A,, gehörigen Minoren der Determinante 
|M | sind. 
Wir setzen nun 


Y, = X — Andy + — KynXn: 


Wenn wir für %9, -.., &m die Ausdrücke (3.8.15) einsetzen, erhalten wir 


= X, + —— ) |MulX:. (3.8.16) 
ran & a 


3) Siehe GANTMACHER [1], S. 281, oder SmıRnow [1], S. 112. 
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Es ist E(Y,) = 0. Weiter erhalten wir 


Br, X) =E Rt Eu 
M,, i=2 
+ —— 3 AM] = A| My: 
a Ze a Zt 
Daraus folgt 
EN für k=1, 
E(Y,X,) =} |Mul (3.8.17) 


0 für k=2,..,n 


Also ergibt sich, daß der ‚Rest‘ Y, mit keiner der Zufallsvariablen X, ..., Xn 
korreliert ist. 


Wir erhalten weiter unter Berücksichtigung von (3.8.17) 


IM] 


Dr)=ED-EHK)- 


(3.8.18) 


Der Ausdruck (3.8.18) heißt Restdispersion. 
Analog erhalten wir für die Koeffizienten der Regressionshyperebene von X, 
bezüglich der übrigen Zufallsvariablen die Formel 


IM, 


Kp = 
ü [Max | 


G@=1,..,k—1, k+1,...,n). (3.8.19) 
Der „Rest‘‘ wird durch die Formel 


Y, = X je B> 1Mu1X; (3.8.20) 
Tr i=1 
i$k 
gegeben. Die Zufallsvariable Y, ist mit keiner der Zufallsvariablen X; @=k) 
korreliert, und die Restdispersion ist gleich 


IM 


D2(Y,)= Bra 


(3.8.21) 


Beispiel 3.8.3. Die Zufelisvariable (X,, X,, X,) habe eine dreidimensionale Normal- 
verteilung mit der Dichtefunktion 


1 Bas 
exp 1 7 [32] + 325 + 325 — 2r2, — 20,0, — Ben 


fe %g, %;) = 3 
(2n)’ 
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Durch einfache Rechnungen erhält man die Momentenmatrix 


1. 
2 2 

1 1 

w=l- 1271; 

2 2 

Ed 

a 

2 2 


Wir wollen die Regressionsebene zweiter Art von X, bezüglich X, und X, bestimmen. 
Aus der Formel (3.8.15) erhalten wir 


1 

ee, — 1 

2.2 2 

ı 1 

= ie 

2 1 2 2 1 
Ra = i 1 y Asa 

2 2 

l 1 

En — 1 

2 2 | 


Die Gleichung der Regressionshyperebene der Zufallsvariablen X, hat also die Form 


1 i 
= sur, 


Nach (3.8.18) ist die Dispersion der Zufallsvariablen 


1 1 
N=-h-;5-;% 


2 
gleich 3° Weiter bemerken wir, daß die Dispersion der Zufallsvariablen X, gleich 1 ist, 


Wie der Leser nachprüfen möge, fällt die Regressionsfläche erster Art der Zufallsvariablen 
X, mit der Regressionshyperebene zweiter Art zusammen. Diese Eigenschaft besitzen alle 
mehrdimensionalen Normalverteilungen. 


©. Das Verfahren zur Bestimmung der unbekannten Koeffizienten der Geraden 
und Hyperebene, das wir in 3.8 angewandt haben, heißt die Methode der kleinsten 
Quadrate. Die Grundgedanken dieses Verfahrens stammen von LEGENDRE [1] und 
Guss [1]. Die weitere Entwicklung dieser Ideen, die für die Wahrscheinlichkeits- 
"rechnung und mathematische Statistik äußerst wichtig sind, verdanken wir 
MARKOoFF [5]. Wir empfehlen dem Leser auch die Arbeit von Davıp und NeyMAn 
[1]. In dem Buch von Lınwık [3] findet der Leser die Beschreibung der wichtig- 
sten Ergebnisse, die bisher auf dem Gebiet der Methode der kleinsten Quadrate 
erzielt wurden. 
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3.9. Aufgaben und Ergänzungen 


1. Man drücke das zentrale Moment .., als Funktion der gewöhnlichen Momente m,, Mg, 
Mm, und m, aus. 


2. Man drücke das gewöhnliche Moment m, als Funktion der zentralen Momente 4, 14, und 
kg AUS. 


3. Man bestimme für die Zufallsvariable X aus dem Beispiel, 3.2.3 die Momente m, und y,.: 
4. Es seien X, und X, unabhängig, und sie mögen die gleiche Verteilung aufweisen. Man 
zeige, daß dann die Zufallsvariable 7 = X, — X, eine symmetrische Verteilung hat. 

Die Ergebnisse der nun folgenden Aufgaben 5 bis 8 stammen von KOLMOGOROFF [7]. 


ö. Die reelle Funktion g (x) sei nichtnegativ. Sie genügt daher der Ungleichung g(«) > 5b >0 
für& > a. Man zeige, daß für jede Zufallsvariable X, für die E (s (X )) existiert, die folgende 
Beziehung gilt: 

E(s(X)) 


PX 2a < —.—. 


6. a) Essei g(x) eine nichtnegative, gerade und außerdem für x>0 nichtfallende Funktion. 
Man zeige, daß für jede Zufallsvariable X, für die X (9 (&)) existiert, die Beziehung 


Eis(X) 
P(IX|22)=s En) 
9(e) 
für jedes e> 0 gilt. 
b) Man beweise mit Hilfe dieser Ungleichung die Tschebyscheffsche Ungleichung. 
7. Eine reelle Funktion g(x) möge für alle x der Ungleichung |g(x)| < K genügen. Man zeige, 
daß die Beziehung 


Fixı2 92 PO) 
K 
für jedes & > 0 gilt. 
8. Es sei P(|X|s M) =1, und es möge die reelle Funktion g(xz) allen Bedingungen der 
Aufgabe 6a genügen. Man zeige, daß für jedes e > 0 


B(g(X)) — ge) 


PIXi2d)2 - 
9(M) 
und insbesondere 
EX) — & 
Biene 
M® 


gilt. 


9. Man zeige (BERe® [1]), daß für beliebige Zufallsvariable Y, und Y, mit den Standard- 
abweichungen 0] und 0, und dem Korrelationskoeffizienten o für jedes k die Ungleichung 


i+y1-e 
_—— 


erfüllt ist. (Eine Verallgemeinerung für Zufallsvektoren mit der Dimension >2 haben 
OLKın und PrArt [1] angegeben.) 


P(Y,—- Ei) ko, oder |%,—E(Y)|>2ko,)=s 


9 Fisz 
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10. 


11. 


12. 


13. 


14. 


a) 


Es sei o der Korrelationskoeffizient der Zufallsvariablen X, und X,. Man zeige, daß dann 
e auch der Korrelationskoeffizient der Variablen Y, = a, X, + bı und Y, = @,X,+ b, ist. 


Die beiden Zufallsvariablen X und Y mögen den gleichen Erwartungswert 0 und gleiche 
Varianz haben. Dann sind die Zufallsvariablen 


Z=XHY, U=-X-Y 
nicht korreliert. Sind sie notwendigerweise auch unabhängig? (Man vergleiche hierzu 
den Satz von SKITOWITScH in 5.7.) 
Die Zufallsvariablen X und Y mögen endliche Momente zweiter Ordnung besitzen; 
Z und U seien durch die linearen Funktionen 
=aX-+bY-+te, 
U=dX-+eY-+f 


definiert. Man bestimme die Koeffizienten a, b, c, d, e, / so, daß Z und Y nicht korreliert 
sind. 


Der Ausdruck 


1 
Gen AzEn) 


in dem m, (X) durch (3.7.1) oder (3.7.1”) gegeben ist, heißt das Korrelationsverhältnis der 
Zufallsvariablen Y bezüglich der Zufallsvariablen X. 
a) Man beweise folgende Behauptungen: 
L0<9,=1. 
II. Die Gleichung 0%, = 0 gilt genau dann, wenn m,(X) = const ist. 
III. Die Gleichung 0, = 1 gilt genau dann, wenn P(Y— m, (X) =0)=1gilt. 
b) Wofür ist das Korrelationsverhältnis ein Maß? 


Man berechne die Korrelationsverhältnisse von Y bezüglich X und von X bezüglich Y 
im Beispiel 2.6.1 und in den Beispielen 3.6.1 und 3.7.1. 


. Es sei 


Y, = X, — ad, 1 An dns 
Y2 = X, — Gfds X; 
wobei E(X)=0 i=1,2,...,n) ist und die Koeffizienten a,; und a; # =3,...,n) 
aus Formeln bestimmt wurden, die der Formel (3.8.15) analog sind. Der Ausdruck 
E(Y,Y,) 
Qi2.a...n 
ErTDEOD 


heißt der partielle Korrelationskoejfizient der Variablen X, und X, bezüglich der Variablen 
X... Xy. Er ist ein Maß für die Korrelation der Zufallsvariablen X, und X, nach 
Elimination des Einflusses der Zufallsvariablen X, ..., X,- 

Man beweise (bezüglich der Bezeichnungen vgl. 3.8.) 


12 | Me! 


012-3... . 
Y!MullMil 
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b) Man beweise 
Q12 — 13023 
1a) 
wobei Q12 Q1s bzw. @5; die gewöhnlichen Korrelationskoeffizienten für die Paare der 
Zufallsvariablen (X, X,), (X X,) bzw. (X,, X,) sind. 
16. Man ermittle sämtliche partiellen Korrelationskoeffizienten für das Beispiel 3.8.3. 
17. Es sei 
X = 0X, ++ 0 
wobei EX) =0(6=1,...,n) ist und die &,; (= 2,...,n) durch (3.8.15) gegeben sind. 
Der Korrelationskoeffizient der Zufallsvariablen X} und X, heißt der multiple Korre- 
lationskoeffizient zwischen X, und (X, ..., X). Wir bezeichnen ihn mit g,(5,„,; es gilt dann 
E(X,X7) 
VeadEa 
Man zeige, daß unter allen Linearkombinationen der Zufallsvariablen X,,..., X, die 
Zufallsvariable X} am stärksten mit X, korreliert ist. 
18. Man berechne sämtliche multiplen Korrelationskoeffizienten im Beispiel 3.8.3. 


19. Man beweise: Die Wahrscheinlichkeit dafür, daß zwischen den Zufallsvariablen X, ..., X, 
mit endlichen Varianzen und Kovarianzen genau n — r lineare Beziehungen bestehen, 
ist dann und nur dann gleich 1, wenn der Rang der Matrix M der Momente zweiter Ord- 
nung gleich r ist. Wir sagen dann, die Verteilung sei vom Rang r (Frisca [1}). 

20. Es sei {X,} (n=1,2,3,....) eine Folge von Zufallsvariablen mit den Erwartungswerten 
EX). Man zeige: Ist 


Q12.3 — 


Eye...n) 


I EUX,)<@, 
n=1 


so gilt 
x x 
E (3 x.) =)Yy E(X,)- 
n=1 n=1 


xo 
Man folgere hieraus, daß die Reihe 3’ X, mit der Wahrscheinlichkeit 1 konvergent ist. 


n=1 


Hinweis. Man stütze sich auf den Satz über die monotone Konvergenz der Folge {Y,}, 
n 
wobei Y, = I |X;| ist. 
k=1 
Siehe auch Aufgabe 4.8.10. 


4. CHARAKTERISTISCHE FUNKTIONEN 


4.1. Die Eigenschaften der charakteristischen Funktionen 


In diesem Kapitel untersuchen wir die Mittelwerte einer gewissen Funktion einer 

Zufallsvariablen und erhalten damit ein Hilfsmittel, das sich bei den weiteren 

Untersuchungen der Wahrscheinlichkeitsrechnung und ihrer Anwendungen auf 
. die Statistik als sehr nützlich erweisen wird. 


Definition 4.1.1. Als charakteristische Funktion der Zufallsvariablen X be- 
zeichnen wir die Funktion 


pl) = Ele), (4.1.1) 


wobei # eine reelle Zahl und : die imaginäre Einheit ist. 
Ist X eine diskrete Zufallsvariable mit den Sprungstellen 


% (k=1,2,...) 


und P(X =x;) = p,, dann wird die charakteristische Funktion von X durch 


pt) = Ele) = mer (4.1.2) 
r 
gegeben. Wegen 


jer|=1 und Yy=1 
P 


ist die Reihe auf der rechten Seite der Formel (4.1.2) absolut und gleichmäßig 
konvergent. Die charakteristische Funktion p(t) als Summe einer gleichmäßig 
konvergenten Reihe von stetigen Funktionen ist also für jeden reellen Wert t 
stetig. 


Beispiel 4.1.1. Die Zufallsvariable X soll die Werte x, = —1 und 2, = 1 mit den Wahr- 
scheinlichkeiten 


PX=-1)=PX=1)=05 


annehmen können. Es ist die charakteristische Funktion dieser Zufallsvariablen zu be- 
stimmen. 
Durch Anwendung der Formel (4.1.2) erhalten wir 


olt) = 0,5et + 0,5eit = 0,5 (cost — isint) + 0,5 (cost + isint) = cost. (4.1.3) 
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Ist X eine stetige Zufallsvariable mit der Dichte f(x), dann wird die charak- 
teristische Funktion dieser Zufallsvariablen durch 


p(t) = E (er) = -/ Ha)e® de © (4.1.4) 
gegeben. Da 
[taole"|de = [ fo) de = 


"ist, konvergiert das Integral in der Formel (4.1.4) absolut und gleichmäßig; 
p(f) ist also eine stetige Funktion von t. 


Beispiel 4.1.2: Die Dichte f(x) sei folgendermaßen erklärt: 
0 für z&<0, 
Ia)=2!1 für 0szs1, (4.1.5) 
0 für z>1. 


Wir sagen, die Zufallsvariable sei im Intervall [0, 1] gleichverteilt. Ihre charakteristische 
Funktion ist 


>} 1 etz 11 ee —i 
et) [ fa)e"da= [ fx) ed = = =, (4.1.6) 
Er 6 GE Io vb ; 


Wir untersuchen einige weitere Eigenschaften der charakteristischen Funk- 
tionen. Es ist 


90) = Ele) = El) =1. (4.1.7) 
Weiter erhalten wir 


kol=IElN| Ss BlleX]))=1, 


also 

PWI<1. (4.1.8) 
Wegen 

9(— 1) = Ele) = E(costX — isnfX) = E(cost X) — iE(sint X) 
und 


pl) = B(e!X) = E(cost X +isint X) = E(cost X) + iE (sin tX) 
erhalten wir 
7-N=rl), 4.1.9) 


wobei o(f) die zu 9(f) konjugiert komplexe Zahl ist. 
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Jede charakteristische Funktion mıuß die Bedingungen (4.1.7), (4.1.8) und 
(4.1.9) erfüllen; diese sind jedoch nicht hinreichend. Nicht jede Funktion #{f), 
die diesen Bedingungen genügt, ist die charakteristische Funktion einer Zufalls- 
variablen. 

Eine andere notwendige Bedingung hat MArcınkırwicz [1] angegeben. Er hat 
gezeigt, daß eine nicht identisch konstante Funktion »(f), die sich in einer Um- 
gebung von {=0 in der Form 


gl) =1 +0) 


darstellen läßt (x > 0), keine charakteristische Funktion sein kann. Hieraus folgt 
z. B. sofort, daß weder p(f) = exp (— #) noch off) = 1/(1 + 1*) charakteristi- 
sche Funktionen sind. Weitere notwendige Bedingungen hat Lukacs [4] an- 
gegeben. Wir wollen hier ohne Beweis den Satz von BocHn&g [2] anführen, der die 
notwendigen und hinreichenden Bedingungen dafür angibt, daß eine Funktion 
o(t) der reellen Variablen t eine charakteristische Funktion ist. 

Satz 4.1.1. Eine für — oo <t< oo definierte Funktion p(t) möge der Gleichung 
(4.1.7) genügen. Die Funktion p(t) ist dann und nur dann eine charakteristische 
Fünktion, wenn ste 


1. stetig ist; 


2. fürn =1,2,... und für beliebige reelle t,, ..., i„ sowie für komplexe a,, .--, 4 
der Ungleichung 


2 pl; — b)a;a, 0 
;k=1 

genügt. 

Den verhältnismäßig einfachen Beweis dieses Satzes findet der Leser in der 
Monographie von Lo&ve [4]. 

Wir erinnern daran, daß eine Funktion, die der Bedingung 2 des Satzes 4.1.1 
genügt, positiv definit genannt wird. i 

Eine andere notwendige und hinreichende Bedingung dafür, daß eine Funktion, 
$ (t) eine charakteristische Funktion ist, hat CRAMER [5] angegeben (siehe Aufgabe 
4.8.3). 


4,2, Charakteristische Funktionen und Momente 


A. Wir betrachten die Zufallsvariable X und setzen voraus, daß ihr Moment 
m, = E(X!) der Ordnung ? existiert. 

Es sei-X eine diskrete Zufallsvariable mit den Sprungstellen x,. Dann kann man 
die Formel (4.1.2) !-mal nach E differenzieren. 

In der Tat, die !-te Ableitung des Ausdrucks unter dem Summenzeichen in der 
Formel (4.1.2) nach t ist gleich 


Pri! al,eiter, 
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Aus der Existenz des Moments I-ter Ordnung folgt die Existenz des absoluten 
Moments i-ter Ordnung. Da 


Zima,e=| = Y|mz;| = Bı 
k k 


ist, darf' man in der Formel für die charakteristische Funktion !-mal unter dem 
Summenzeichen differenzieren. Wir erhalten also 


pt) = Npyiialeitr — Bf! Xleitx], (4.2.1) 
k 


Nun sei f(x) die Dichte einer stetigen Zufallsvariablen X. Dann kann man die 
Formel (4.1.4) !-mal nach i differenzieren. 
In der Tat, die I-te Ableitung. des Integranden in der Formel (4.1.4) nach t ist 
gleich 
da f(w)eite. 


Weiter erhalten wir 
+] 


[ Warr@ertaa = | I#i@)lde =Bı. 


Nach Voraussetzung ist das absolute Moment f, endlich; folglich darf man in der 
Formel für die Funktion o{f) I-mal unter dem Integralzeichen differenzieren. 
Somit erhalten wir 


—o0 


gU(t) = is dx! x)et® de = Bil XletX]. (4.2.2) 
Wir haben damit für eine stetige Zufallsvariable dasselbe Ergebnis bekommen 
. wie für eine diskrete Zufallsvariable: 

p&(t) = Eli! Xteix]. (4.2.3) 
Aus der Gleichung (4.2.3) berechnen wir 9&(0) und erhalten 


gO(0) =EER) = im, 
also 


ee (4.2.4) 
ji 
Somit haben wir den folgenden Satz bewiesen: 
Satz 4.2.1. Existiert das I-te Moment einer Zujallsvariablen X, dann wird es 
durch die Formel (4.2.4) gegeben, in der g" (0) die I-te Ableitung der charakteristi- 
schen Funktion p(f) von X im Punkt t = ist. 
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Beispiel 4.2.1. Die Zufallsvariable X habe cine Poissonverteilung, d.h., sie kann die 
Werte x, = k annehmen, wobei k eine ganze nichtnegative Zeit ist. Ihre Wahrscheinlichkeits- 
funktion wird durch 


ak 
PX=h= Er et (4.2.5) 
gegeben; dabei ist A eine gewisse positive Konstante. Wir wollen die charakteristische Funktion 


dieser Verteilung bestimmen. 
Nach der Formel (4.1.2) erhalten wir 


N |; Se 
e(t) => eilk Fr et er Par == ertelet — eKet—1), (4.2.6) 
Weiter ist 
op (t) = Aielterlet 1), 
Auf Grund der Formel (4.2.4) erhalten wir 
m En (4.2.7) 
Ebenso berechnen wir 
pt) = Altetetle=1) (a Belt + Be , 
also 
m ED gar. 42.8). 
Das zentrale Moment zweiter Ordnung ist somit 
KAHN) R2=4. (4.2.9) 


In ähnlicher Weise kann man die Momente höherer Ordnung berechnen. 


Beispiel 4.2.2. Wir wollen die charakteristische Funktion einer Normalverteilung und 
ihre Momente berechnen. Es ist 


1 _& 
fx) > >= € 2, 
yar 
also 
ı f.-® N er _® _e 
pl) = —— eiteg 2? de= —— e 2 ee ?2de=e ?. (4.2.10) 
Y?r Y2r 
-0 © © 


2 
Da p(t) = —te 2 ist, ergibt sich 


=0. (4.2.11) 
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Weiter erhalten wir 
E 
op” () =e 2 (#2 ae 1), 


also 


My = 


=1. (4.2.12) 


Diese Werte für m, und m, haben wir schon in den Beispielen 3.1.4 und 3.2.2 erhalten. 
Wie der Leser nachprüfen kann, sind alle ungeraden Momente gleich Null, während die 
geraden Momente durch die Formei 


My =1-3:5--(21 — 1) (4.2.13) 
gegeben werden. 


Wir weisen darauf hin, daß die Umkehrung des Satzes 4.2.1 nicht gilt. In 
Aufgabe 4.8.9 findet der Leser ein Beispiel für eine Zufallsvariable, deren Er- 
wartungswert nicht existiert und deren charakteristische Funktion an der Stelle 
t = 0 differenzierbar ist. Besitzt jedoch die charakteristische Funktion (f) an der 
Stelle = 0 eine endliche Ableitung der geraden Ordnung 2%, dann existiert ein 
Moment der Ordnung 2% der entsprechenden Zufallsvariablen (vgl. Aufgabe 4.8.8). 
Dann existieren aber bekanntlich auch alle Momente, deren Ordnung kleiner ist 
als 2k. i ; 


B. Wir wollen nun untersuchen, wie sich die charakteristische Funktion der 
Zufallsvariablen X verhält, wenn wir X linear transformieren. 
Wir betrachten zunächst die Translation 


Y=X-+b. 


Wenn wir mit 9, (t) die charakteristische Funktion der Zufallsvariablen Y bezeich- 
nen, erhalten wir 


9, (1) = Ele?) = BfeitX+0) — El(eitX) eitd — edel). (4.2.14) 


Wir sehen also, daß bei einer Translation um eine Konstante b die charakteristische 
Funktion mit dem Faktor ei multipliziert wird. 
Es sei jetzt 


Y=aX. 
Wir erhalten 
9,() = Ele!) = Elek) — (al). (4.2.15) 


Die charakteristische Funktion der Zufallsvariablen a X ist also gleich der charak- 
teristischen Funktion der Zufallsvariablen X im Punkt at. 
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Insbesondere ergibt sich für a = —1 


al) = pl) =pll. 
Wir betrachten nun die Transformation 
Y=aX-tb. 


Bezeichnen wir mit p(f) bzw. 9, (t) die charakteristischen Funktionen der Zufalls- 
variablen X bzw. Y, so erhalten wir aus den Gleichungen (4.2.14) und (4.2.15) 


pt) = ettplat). (4.2.16) 
Insbesondere sei 


vr _ AM 


Ko2 


wobei m, bzw. o der Mittelwert bzw. die Standardabweichung der Zufallsvariablen 
X sind. Wir erhalten dann 


mit fi 
n=e "p ()- | (4.2.17) 


4,3. Die Semiinvarianten 


Manchmal ist es angebracht, die Verteilung einer Zufallsvariablen nicht durch die 
Momente, sondern durch eine andere Gruppe von Parametern zu charakterisieren, 
die wir erhalten, wenn wir die Funktion 


y(t) = log pti) | (4.3.1) 


betrachten; dabei ist p(f) die charakteristische Funktion der Zufallsvariablen. 
Wir entwickeln die Funktion p(f) in der Umgebung des Punktes # = 0 formal 
in eine unendliche Reihe: 


Sm, 
ei T— dir. (4.3.2) 
s=1 si! 
Mit z bezeichnen wir die um 1 verminderte rechte Seite von (4.3.2) und ent- 


wickeln die Funktion y(tf) formal in eine Potenzreihe: 


(t) = log y(i) = lo TERUR UBE DR ARE 0, (4.3.3) 
yl) = 108 pl) = 108 7a 2 3 275 . 3. 


4.3. Die Semiinvarianten 139 


Aus (4.3.2) und (4.3.3) erhalten wir formal 


nie) 


s=1$ 


1 © Ba 2 1 © 3 
-1 +24 au: ER RT ER] Ti 
(4.3.4) 


Definition 4.3.1. Die in der Formel (4.3.3) auftretenden Koeffizienten x, 
nennen wir Semiinvarianten. 

Um die Semiinvarianten durch die Momente bzw. die Momante durch die 
Semiinvarianten auszudrücken, vergleichen wir die Koeffizienten von (sf)° in 
(4.3.4). Auf diese Weise erhalten wir 


kı=M, 
ni 4 
% = My — mi = 0%, 
Hy = My — 3M My; + 2m}, (4.3.5) 
4 = m, — 3m: — Amımz; + 12mim, — 6m}, 


und ebenso. 
Mm = %, 
My = rg, + “1 . 
My; =, + 3% 4 > (4.3.6) 
My = Ha + 3) + Arına + 6 + 


a Er EEE Er Er SE SE EEE BE Er 


Die Semiinvarianten lassen sich auch durch die zentralen Momente ausdrücken: 


% = mM; 
% = Mg = 0°, 


eh i (4.3.7) 


Aus den Formeln (4.3.5) und (4.3.6) folgt: Existiert das Moment /-ter Ordnung, 
so existieren auch alle Semiinvarianten, deren Ordnung nicht größer als I ist. 


& 
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Die Bezeichnung ‚„Semiinvariante‘‘ erklärt sich daraus, daß bei einer Trans-' 


lation der Zufallsvariablen X, d.h. bei einer Transformation Y/=X +5, alle 
Seminvarianten außer x, unverändert bleiben. In der Tat, wenn wir mit o(f) bzw. 
9, (f) die-charakteristischen Funktionen der Zutellyaridplen X bzw. Y bezeich- 
nen, SO folgt aus (4.2.14) 


log p,(t) = bit + logo). (4.3.8) 


Die Translation ändert nur den Koeffizienten von :t, d.h. den Koeffizienten der 
ersten Potenz in der Entwicklung (4.3.4), also nur die Semiinvariante erster 
Ordnung. 


Beispiel 4.3.1. Wir berechnen die Semünvarianten der im Beispiel 4.2.1 besprochenen 
Poissonverteilung. 
Die charakteristische Funktion der Poissonverteilung ist 


pi) = lern, 


Daraus erhalten wir 


© fitk © (gryk 
yi) = logpli)= Mel —1)= 1 (2 Wi ) =ıiYN en (4.3.9) 
i=o KR! ri k! 
Aus (4.3.3) ergibt sich . 
=A (k=1,2...). (4.3.10) 


Benutzen wir die Beziehungen, die zwischen den Semiinvarianten und den 
Momenten bestehen, so können wir auf Grund der Formel (4.3.10) für die Poisson- 
verteilung Momente beliebiger Ordnung berechnen. 


4.4.  . Die charakteristische Funktion einer Summe 
unabhängiger Zufallsvariabler 


Es seien X und Y unabhängige Zufallsvariable. Aus den Untersuchungen in 2.8 
folgt, daß dann die Zufallsvariablen e®* und e“Y ebenfalls unabhängig sind. 
Wir wollen nun die charakteristische Funktion der Summe 


Z=X+Y 
von zwei Zufallsvariablen bestimmen. 


Mit o(t), 9, (f), 9,(f) seien die charakteristischen Funktionen der Zufallsvariablen 
Z, X bzw. Y bezeichnet. Wir erhalten 


p(t) = Blei!) = E(etA+9) — H(etXeitr).- (4.4.1) 
Da die Zufallsvariablen e“X und e’'7 unabhängig sind, ergibt sich aus Satz 3.6.2 
pt) = El) EN = pP. (4.4.2) 


Dieses Ergebnis kann man auf die Summe endlich vieler unabhängiger Zufalls- 
variabler verallgemeinern. 
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Satz 4.4.1. Die charakteristische Funktion der Summe endlich vieler unabhängiger 
Zufallsvariabler ist gleich dem Produkt der charakteristischen Funktionen dieser 
Zufallsvarvablen. 

Wenn also Z die Summe von rn unabhängigen Zufallsvariablen ist, 


Z=R, +8, ++ X, 


und o(f) bzw. (tl) (k=1,2,...,n) die charakteristischen Funktionen der Zu- 
fallsvariablen Z bzw. X, sind, erhalten wir 


er (4.4.3) 


Beispiel 4.4.1. Wir betrachten zwei unabhängige Zufallsvariable X, und X, mit Poisson- 
verteilungen. Dabei sei für r =.0,1,2,... 


ar 
PX,=rn)= er eh, 


T 


2 
PX,=r)= = ers, 


Wir suchen die charakteristische Funktion der Zufallsvariablen Z= X, — X, und die 
Semiinvarianten ihrer Verteilung. 
Nach der Gleichung (4.2.6) sind die charakteristischen Funktionen o,(f) und @,(f) der 
Zufallsvariablen X, und X, gleich 
pl) = ehilet-1), 
Pal) = let, 
. Die charakteristische Funktion der Zufallsvariablen — X, hat wegen der Beziehung (4.2.16) 
die Gestalt 
p(—t) = ide, 
Berücksichtigen wir die Unabhängigkeit der Zufallsvariablen X, und — X, sowie die Gleichung 


(4.4.2), so erhalten wir als charakteristische Funktion der Zufallsvariablen Z den Ausdruck 


o)= errte® —1) gAlemt—1) — glielttAzemti— iR, 


Wenn wir die Exponenten ei! und e® in Potenzreihen entwickeln, erhalten wir 


a a rt 
e 3 


eh) = ! R 
2 es Re 
(et) (st) (et) ee 


vl) = logpfli) = (A, As) T + (Ay + A) FT Fr (A — %) 31 


‚Aus den Gleichungen (4.3.3) folgt, daß alle ungeraden Semiinvarianten der Zufallsvariablen 
Z gleich A, — A,, alle geraden gleich A, + A, sind. Aus den Formeln (4.3.5) erhalten wir für den 
Mittelwert und die Dispersion: 


m=m=h—h, 


2 =,=h+4,. 
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Wir bemerken, daß die Umkehrung des Satzes 4.4.1 nicht gilt. Auch die charak- 
teristische Funktion der Summe abhängiger Zufallsvariabler kann gleich dem 
Produkt ihrer charakteristischen Funktionen sein. Wir wollen das an einem Bei- 
spiel zeigen. 

Beispiel 4.4.2. Die Verteilung der Zufallsvariablen (X, Y') sei durch die Dichte 

J . 
1 
— I+z2y@®—y3)) für. Ja2]jsli und |yIs1l, 
f (9) = 4 f 
0 für die übrigen Punkte 


definiert. Wir zeigen zunächst, daß X und Y abhängig sind. 
Die Randdichten werden in den Gebieten |z| s1 und |y| <1 durch die Formeln 


1 
1 1 a ayilt 1 
pen en 2 __ 92 
no [ZU test Pl dy z | 5 |, 2° 
—1ı 
1 
1 1 Ay pl 1 
Ba Ss 2 _32 '2e: = 
f.(y) fi U + 2y(@® — y9)] de z [*- 7 5 L, = 


Fi: 
gegeben. Daraus folgt f(x) fa(y) = — + f{&,y); die Variablen X und Y sind also nicht un- 
abhängig. . 

Nun suchen wir die Diehte der Summe Z= X -- Y. Aus (2.9.8) ergibt sich 


Ite) = [ Hz — a) de. 


Um die von z abhängigen Integrationsgrenzen dieses Integrals zu finden, beachten wir, daß 
bei der Einführung der Zufallsvariablen »,2 statt x,y das quadratische Gebiet |e| = 1, 
|y| 1 in ein durch die Ungleichungen 


aIl<l, z-i<sS2e<cH1 (4.4.4) 


bestimmtes Gebiet übergeht. Diese Transformation wird durch Abb. 4.4.1 und 4.4.2 illustriert. 
In Abb. 4.4.1 ist das Gebiet |x] <1, |y| <1 der z,y-Ebene dargestellt, in Abb. 4.4.2 das 
Gebiet der x,2-Ebene, das aus dem vorhergehenden durch die Transformation «= v,2=x2 +% 
hervorgeht. Wir schreiben die Ungleichungen (4.4.4) in der Gestalt 


al<1l, z-1se2esSz +1. 
Dann gelten für 2<0 die Ungleichungen 
z—1s-—Il, z+1=s1 
und für 2> 0 die Ungleichungen 
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Wir haben also für 2< 0 in den Grenzen von —i bis 2-+ 1 undfür z> 0 in den Orenzen 
von z— 1 bis1 zu integrieren. Nach einfachen Umformungen erhalten wir 


2+1 


u (1 + 322° — 22a? — 2’) de 


Abb. 4.4.1 Abb. 4.4.2 


Eine Verteilung, wie sie die Zufallsvariable Z besitzt, nennen wir Dreiecksverteilung. 


In Abb. 4.4.3 ist, die Funktion f,(z) dargestellt. 
Wir bestimmen nun die charakteristischen Funktionen @, (f), @,() und 93(t) der Zufalls- 


variablen X, Yund Z=X-+ TV. Dann erhalten wir 


al) — | dt de = -—- Re ; a ei et = sin t 
; 5 | ıE 1-ı 2it i 
und ah 
sin # 
P ($ FE Fa: 
ei 


Abb. 4.4.3 
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Berücksichtigen wir, daß die Zufallsvariable Z nur Werte aus dem Intervall [—2, 2] annimmt, 
so finden wir 


1 [2 — et — —| 


0 2 
1 ; 1 ; 

A) -z [ernwar [e-near-Z| m 
2 6 


1 er 4 g-zit 1 (sin #\? 
= — (1 —l- (1— cos2t) = |—) . 
21? “2 282 c 


Daraus folgt, daß die Gleichung 9@,(t) = 9, (f)9z(t) gilt, obwohl die Zufallsvariablen X und 
Y abhängig sind. 


4.5. Die Bestimmung der Verteilungsfunktion dureh die 
charakteristische Funktion 


A. Durch die Formel (4.1.1) wird zu einer gegebenen Verteilung eindeutig die 
charakteristische Funktion definiert. Man kann zeigen, daß auch das Umgekehrte 
der Fall ist: Durch die charakteristische Funktion ist die Verteilungsfunktion 
eindeutig bestimmt. Dazu beweisen wir den Satz von Levy [3]. 


Satz 4.5.1. Es seien F(x) bzw. p(t) die Verteilungsfunktion bzw. die charak- 
teristische Funktion der Zufallsvariablen X. Sind a->h und a—h(h>0) be- 
liebige Stetigkeitsstellen der Verteilungsfunktion F (x), so ist 


T 


F(a+h)— F(a— h)=lim N ea (t) dt. (4.5.1) 
Too T 
—T 


Bevor wir zum Beweis kommen, wollen wir die Bedeutung dieses Satzes er- 
läutern. Da die Größen a und 3 beliebig sind, erhält man aus der Formel (4.5.1) 
für beliebige Stetigkeitsstellen x, und x, die Differenz F(x,) — F(x,). Wegen der 
Beziehung 


Fa) -Fa)=- Pi sX<%) 


erlaubt uns also der Satz 4.5.1, die Wahrscheinlichkeit dafür zu berechnen, daß 
der Wert von X einem beliebigen Intervall angehört, dessen Endpunkte Stetig- 
keitsstellen der Verteilungsfunktion F(x) sind, wenn wir die charakteristische 
Funktion p(t) kennen. Es sei x = x, eine Stetigkeitsstelle. Wir betrachten auf der 
Menge der Stetigkeitsstellen den Grenzübergang x, — — co. Die Folge der Diffe- 
renzen F(x) — F(x,) kann dann aus der charakteristischen Funktion berechnet 
werden. Da sie gegen F'(x) konvergiert, kann die Verteilungsfunktion F(x) in 
einer beliebigen Stetigkeitsstelle bestimmt werden und ist damit überall bestimmt. 
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Wir kommen nun zum Beweis des Satzes 4.5.1. 


Beweis. Wir führen den Beweis nur für eine stetige Zufallsvariable mit der 
Diehtefunktion f(x). Es sei 


T 


ne 1 SR (4.5.2) 


Wenn wir die Definition der charakteristischen Funktion beachten, erhalten wir 


To 
J= = I etaeitz } (x) dx dt 
IT 


-T7T-0 
Do 
= ir f RR a0) dedt. 
7 t 
-T —oo 


In diesem Integral können wir die Reihenfolge der Integration ändern, weil die 
Integrationsgrenzen bezüglich t endlich sind und das Integral bezüglich x absolut 
konvergent ist. Es ist nämlich 

)desh [mas fx 


I f)dz= ja 


Wir erhalten also 


oo T 
-—[ [FF eormarae 
E14 t 


-o-T 


sin hi sin ht hi 
[i 


_— eitle- [3] 


-1[ je a {cos [(x — a)t] ee) fa) did« 


-0 —T 


a cos (x — a)tlf(a)dt dx. 
7 t j 


-o 0 


Wenn wir die Formel 


sin(4A-+-B)+sin(4 — B) 
2 


snAcosB= 


10 Fisz 
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anwenden und A=ht,B=(& = a)t setzen, erhalten wir 


“ a = 
„= fir ferner, 21 fee an] una 
Te t z t 
-o 0 0 x 
- [0% T)f(«) de, (4.5.2) 


wobei g(x, T') der Ausdruck in der eckigen Klammer ist. Aus der Analysis ist be- 
T 


kannt, daß das Integral rn 


dx für ale T>0 beschränkt ist und für 


8 
T— oo gegen = konvergiert. Daraus folgt, daß auch der Ausdruck |g(«,T)| 
beschränkt ist und daß 


Bi Er 
mt fm] 3 
en 2 -—— für a <0. 

2 


für «>0, 


Dabei ist die Konvergenz gleichmäßig in « für 
ol=le-a+hl>5>0. 
Wenn wir dieses Ergebnis beachten, erhalten wir 
(0 für e<a—h, 
ei für =a—h, 
2 
img@, =} 1 für a-h<a<a-+k, (4.5.3) 
Too 1 
für z=a-+h, 
0 für z>a-+h. 
Daraus folgt: Bei der Berechnung vom lim J kann man unter dem Integral auf 


To 
der rechten Seite der Formel (4.5.2’) zur Grenze übergehen. 
Wenn wir noch berücksichtigen, daß die Verteilungsfunktion F(x) in den 
Punkten z=a—hund z=a-+h stetig ist, erhalten wir 


co a+k 
lim = [ limg(e, T)f(«) de = [i@de=F(a+h)— Fla—h). 
To -o Too a—h 


(4.5.4) 
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Aus (4.5.2) und (4.5.4) ergibt sich die Formel (4.5.1). Der Satz ist damit für stetige 
Variable bewiesen. Für diskrete Variable ist der Beweis analog; die Integrale sind 
nur durch Reihen zu ersetzen. 


B. Ist die charakteristische Funktion $(f) im Intervall (— oo, oo) absolut inte- 
grierbar, dann kann auch die ihr entsprechende Dichtefunktion f(x) durch die 
Funktion 9 (t) bestimmt werden.*) Aus der absoluten Integrierbarkeit der Funktion 
o(t) folgt nämlich, daß das uneigentliche Integral (4.5.1) existiert. Wir dividieren 
beide Seiten der Gleichung (4.5.1) durch 2% und erhalten 


oo 


Fee RN BEN eg 4.5.5) 
23h 2% hi 


00 
Di 


wobei c+h und x — h Stetigkeitsstellen von F(x) sind. Strebt 3 gegen Null, 
dann strebt der Ausdruck unter dem Integral gegen e**o(t). Außerdem ist der 
absolute Betrag des Ausdrucks unter dem Integral nicht größer als |o.(f)|; es 
sollte aber p(f) nach Voraussetzung absolut integrierbar sein. Daraus folgt, daß 
man auf der rechten Seite der Gleichung (4.5.5) unter dem Integral zur Grenze 
für A —0 übergehen kann. Wir erhalten dann 


» lim Fe+h-F@-h = ı et o(t) di. 
R>0 2h 2n 


Da die rechte Seite dieser Gleichung eine stetige Funktion von « ist, erhalten wir 
daraus 


F (x) = f(x) = 35 j etz gp(t) di. (4.5.6) 


Aus der absoluten und gleichmäßigen Konvergenz dieses Integrals ergibt sich, 
daß die Dichte F’(x) eine stetige Funktion ist. Also erlaubt die Formel (4.5.6), 
die Dichte f(x) mit Hilfe der charakteristischen Funktion 9 (f) zu bestimmen, wenn 
»(f) absolut integrierbar ist. Wie man sieht, ist (4.5.6) die Umkehrung der Formel 
(4.1.4). 
Beispiel 4.5.1. Die charakteristische Funktion der Variablen X sei durch 
Fi 3 \ 
gl)=e ? 
gegeben. Gesucht ist; die Dichte dieser Variablen. 


1) Wie van DER Vaarr [2] kürzlich gezeigt hat, gilt dies auch bei schwächeren Voraus- 
setzungen über die Funktion oft). ; 


10* 
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Aus Gleichung (4.5.6) ergibt sich 


= 2 


1 ae 1 2 iria)? in)? 
x) = — -ürg 2 di = — 2 e? d 
ie =) m)‘ 
oo 


(i+ir)? ea 
2 di= ——e ?. 


er 
= —e 2? — |e 
y2r il y2r 
ut] 


Dies ist die Dichte der Gaußschen Verteilung. 


\ 

Der Leser vergleiche dieses Ergebnis mit dem Ergebnis (4.2.10) im Beispiel 
4.2.2, wo wir die umgekehrte Fragestellung betrachteten; als Lösung fanden wir 
die charakteristische Funktion einer Gaußschen Verteilung. 

Ist die Zufallsvariable X diskret und nimmt sie nur ganzzahlige Werte an, 
dann kann man leicht ihre Wahrscheinlichkeitsfunktion durch die charakteristi- 
sche Funktion bestimmen. 

Für jedes ganzzahlige % sei 


wobei selbstverständlich nicht alle Wahrscheinlichkeiten positiv sein müssen. 
Dann ist 


s 
oo 


= N me. 


k=—-o 


Ist %’ eine bestimmte ganze Zahl, so erhalten wir 
| ’ = fe 
er) N IH + Dr. 


Wenn wir beide Seiten dieser Gleichung in den Grenzen von —x bis x integrieren 


und beachten, daß für jedes k=#Kk' 
fer@-naı =0 
ist, so erhalten wir nach Weglassen des Strichs bei k’ 
| 
= fe o(t) dt. (4.5.7) 
2% 


Der Leser beachte die Analogie der Formeln (4.5.6) und (4.5.7). 
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©. GnEDENKo [1] hat bewiesen, daß durch die Werte, die die charakteristischen 
Funktionen auf.einem endlichen Intervall annimmt, die Verteilungsfunktion noch 
nicht eindeutig bestimmt ist, Dies wird das folgende Beispiel zeigen. 


Beispiel 4.5.2. Wir wollen die Dichte /(x) der Zufallsvariablen X bestimmen, deren charak- 
teristische Funktion folgendermaßen definiert ist: 


i 1 — |£] für | <1, | (4.5.8) 
9 —1o für | >1. 2 


Offensichtlich ist die Funktion 9, (£) im Intervall —oo<t<oo absolut integrierbar. Aus 
Formel (4.5.6) ergibt sich 


o 0 ı 
1 ; i \ i i 
fa) = — | eo lt) di = — | (1 +NEHRdE + — | (1 -Netedt, 
In . 2% 27 
oo —-ı 6 
h) 0 


. e-üz 0 1 ’ 
fe - teritzdt = | — (1-+ ] = = fe 
— iX —ı — 1% 
—ı 


1. 1fe* 1 1 ..; i 
En Ike ; =-—-.141-e), 
—i2 |_ı °% (ix)? 


1 1 
a ut 1 1 r 
fe-nra- E — (i- ] + — fer 
— 1% 0 — 1% )- j 
I) 0° 


1 1 leri« Jı 1 1 A 
ee SH le): 


—izlo i® (2)? 


Daraus erhält man 


fa) (2 ei ie) i A er 4 ei® 1— cosz m 5.9) 
x) = — el® — e- — = —. .5. 
ana? na 2 ex 
Nun wollen wir die diskrete Zufallsvariable Y mit der Wahrscheinlichkeitsfunktion 
PY=0)= : 
— = E 
2 ß 
PIY 2k—1 k=0, 41,42... 4.5.10 
[r=( = RE Er.) (4.5.10) 
betrachten. Als charakteristische Funktion @,(f) dieser Verteilung finden wir 
1 22 2 
= — _— ell(2E—1)r 
RÜ=,r 2, (Ok — em“ 
1 2 8 cos(?k — 1)in + isin(2k — 1)in 
2 et @E — 1) 
1 4 8 2k— 1) 
Bee er (4.5.11) 
2 ma (@k— 1% 


150 4. Charakteristische Funktionen 


Wie wir zeigen. werden, gilt für It <1 die Beziehung 9, (f) = gt). 
Die Funktion y{t) = |t} entwickeln wir im Intervall |f] < 1 in eine Fourierreihe: 


[7 x 
vl=— + Y a,cosnnt. 
2 a=1 


Die Koeffizienten dieser Entwicklung berechnen wir aus den Formeln 


1 


Go 1 
= I td=—, 
2 2 


0 


1 1 
2tsinnnt |l 2 F 
0,=2 | teosnntdi _ sinnztdt 
NT o am 
0 0 


2 = cos | coonn —1 


NT NIE o zn? 


Für gerade n ist @, = 0, und für ungerade, d.h. für n = 2k — 1, ist 


4 


ma NE pn 


Endgültig erhalten wir 


1 48 os(dk-— int 
ne in (4.5.12) 


2 =, (k-— 1% 


ve = El 


und aus den Formeln (4.5.11) und (4.5.12) 


2-1 =gp ll), 


obwohl @,(f) und 9,(t) charakteristische Funktionen verschiedener Verteilungen sind. 
Für [!| > 1 sind die charakteristischen Funktionen 9, (f) und 9,(f) nicht gleich, denn nach 
‚Definition ist dort 9,(f) = 0, während die Funktion g,(f) nicht identisch gleich Null ist; die 
Werte, die diese Funktion im Intervall |i| < 1.annimmt, wiederholen sich nämlich auf der 
ganzen f-Achse periodisch. 


4.6. Die charakteristische Funktion einer mehrdimensionalen Zufallsvariablen 


A. Der Begriff der charakteristischen Funktion einer eindimensionalen Zufalls- 
variablen kann auf Zufallsvariable mit endlich vielen Dimensionen ausgedehnt 
werden. Wir beschränken uns hier auf zweidimensionale Zufallsvariable. 

Es sei (X, Y) eine zweidimensionale Zufallsvariable, t und u seien beliebige 
reelle Zahlen. Die charakteristische Funktion der Zufallsvariablen (X, Y) wird 
durch 

ol, u) = El(e{ttWN) (4.6.1) 


definiert. 
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j 


Beispiel 4.6.1. Die zweidimensionale Zufallsvariable (X, Y') soll die vier Zahlenpaare 
(1,1) (1, —1) (-1,1) (—1, —1) mit den Wahrscheinlichkeiten 


1 1 
PX=1,Y=-)=-—.. PX=1,Y=--)=-—, 


1 Re 
PX=-AY=)=n PX=-L,Y=-)=z 


annehmen können. . ; : 
Wie sich der Leser leicht überzeugt, sind die Zufallsvariablen X und Y unabhängig. Wir 
berechnen die charakteristische Funktion der Zufallsvariablen (X, Y) nach (4.6.1) und erhalten 


ott,u) = El(etX+ur)) — a eittu) L Es eti-u) Eu et-tru) 4 > eit-t—u) 
3 3 6 6 
u das ; Erassn : 
ei (ei + e-iu) + = eit (et + e-iu) 
5 ; ; ; 1 Br 
= — (et + ei) (Zeit et) = =. cosu(3 cost +isint). (4.6.2) 


Jetzt wollen wir einige Eigenschaften der mehrdimensionalen charakteristischen 
Funktionen untersuchen: 


9(0, 0) = E(el +9) — 1, (4.6.3) 
Ip&, u)| = Bet) < Ele) = 1, 

also 
Pi&wW|l=sl, B (4.6.4) 
pl—t, —u) = Klett) — Sf,u). (4.6.5) 


Ebenso wie für eindimensionale Zufallsvariablekann man zeigen: Existieren alle 
Momente k-ter Ordnung der Zufallsvariablen, so existieren auch die Ableitungen 


öt pt, u) 


für 1=0,1,2,...,k, (4.6.6) 
or tdu! 


und man kann sie aus der Formel 


doplt j 
en — ir H(X+-1 YIegtX+un)) (4.6.7) 


erhalten. Aus dieser Gleichung erkennt man, daß man die Momente m,_,,, aus der 
Formel 
1 lFolt 
nr ren (4.6.8) 
. “| ou | 
0 
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berechnen kann. Damit erhalten wir für die Momente erster und zweiter Ordnung 
die Ausdrücke 


m. LI) m. A |2p& 
rer es | de 
u=0 u=0 
mt Er m. tert 
"Tal or In “Tal d0u Io 
u=0 u=0 
er _1rbw ; (4.6.8°) 
"al 9 |,oe = 
u=0 


Die charakteristischen Funktionen der Randverteilungen der Zufallsvariablen 
X bzw. Y erhalten wir aus den Gleichungen (4.6.1), wenn wir v=0 bzw. t=0 
setzen. Es ist 


9(t,0) = Eie*) =): (4.6.9) 
Das ist die charakteristische Funktion der Zufallsvariablen X. Analog ist 

(0, u) = Ele!) = 9,(u) (4.6.10) 
die charakteristische Funktion der Zufallsvariablen r. | 


B. Wir wollen nun ohne Beweis die Verallgemeinerung des Satzes 4.5.1 für zwei- 
dimensionale Zufallsvektoren angeben. Der Beweis ist dem des Satzes für eine ein- 
dimensionale Zufallsvariable ähnlich. 

Satz 4.6.1. Es sei o(t,u) die charakteristische Funktion der Zufallsvariablen 
(X, Y). Ist das Rechteck (a kh<&X<a+h,b—-gsY<b-+g) ein Stetig- 
keitsrechteck (vgl. Definition 2.5.6), so gült 


D ® " 


Pa-h<sX<a+thb—-g9g<Y<b+g- 


Sind paul SDR: exp (—i(at + bu))pii,u)didu. (4.6.11) 


T>00 n? 
-T -T 


Die Formel (4.6. ‚11) gestattet uns s somit, falls 9(t, u) bekannt ist, die Wahrschein- 
lichkeit 
Pan sXi<m,y S Y. <%,) (4.6.12) 


' für ein beliebiges Stetigkeitsrechteck zu berechnen. Die Wahrscheinlichkeiten 
(4.6.12) für Stetigkeitsrechtecke bestimmen aber vollständig die Wahrscheinlich- 
keitsverteilung in der x, y-Ebene. 
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Satz 4.6.2. Es seien F (x, y), Fı(&), Fs(y), @(k, u), 9, (t) und 9, (u) die Verteilungs- 
funktionen und die charakteristischen Funktionen der Zufallsvariablen (X, Y), 
X und Y. Die Zufallsvariablen X und Y sind dann und nur dann unabhängig, wenn. 
die Gleichung 


lb, u) = pılt) p2(u) (4.6.13) 
für beliebige reelle t und u erfüllt ist. 


Beweis. Es seien X und Y unabhängig. Nach Satz 3.2.2 gilt für beliebige reelle 
gig. Na 8 8 
tund % 
plt, u) = Ele) — B(eX)E (er) = g,(t)p(u). 


Nun sei die Gleichung (4.6.13) erfüllt. Dann erhalten wir aus (4.6.13), (4.6.11) und 
(4.5.1) die Gleichung 
Pa sX<m,yısY<y)=-PmsX<)PysTY<p), 
(4.6.14) 


die für beliebige Stetigkeitsrechtecke gilt. Aus (4.6.14) folgt für beliebige x undy 
Fa, y) = F(@)F;(y). 


Damit ist der Satz bewiesen. 
Der nachstehende Satz von CRAMER-WorD [1] ist für die Theorie der Verteilung 
von Zufallsvektoren von Bedeutung. 


Satz 4.6.3. Die Verteilungsfunktion F(x,y) einer zweidimensionalen Zufalls- 
variablen (X, Y) ist eindeutig bestimmi durch die Klasse aller eindimensionulen 
Verteilungsfunktionen der eindimensionalen Zufallsvariablen IX + wY, wobei t und 
u die Menge aller reellen Zahlen durchlaufen. 


Beweis. Für alle reellen # und u seien die charakteristischen Funktionen 
p,w) von Z=1X-+uY gegeben: 


p,(0) = Elexp(ivtX + uY))] = Elexp(iwiX + vu). (4.6.15) 
Setzen wir v» = 1, so erhalten wir auf der rechten Seite von (4.6.15) den Ausdruck 
pt, u) = EfexpiltX +uN)], 


der die charakteristische Funktion der Verteilungsfunktion F(x,y) darstellt. 
Nach Satz 4.6.1 definiert die Funktion p(t, w) eindeutig die Funktion F(x, y). 
Damit ist der Satz bewiesen. 

Wir schreiben 


PiX-+-uY<2)=P(Xcosa+Ysin«<w) 
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mit 
[i n U 2 


———, sing = ————, W = —— (0 
ye +42 S Ve + u ye +42 


Der Satz von CRAmMER-Worn läßt sich jetzt wie folgt formulieren: Die Verteilungs- 
funktion F(x,y) ist eindeutig bestimmt durch die Verteilungsfunktion der Projek- 
tionen von (X,Y) auf alle durch den Koordinatenursprung hinduürchgehenden 
Geraden. 

Wie Räxvı [5] gezeigt hat, gilt die folgende Behauptung: Genügt (X, Y) mit 
der Wahrscheinlichkeit 1 der Ungleichung 


cs = <za<s2n). 


XLYr<R<o, 


so ist die Verteilungsfunktion F(x, y) durch die Verteilungsfunktionen der Zu- 
fallsvariablen X cos« + Ysin« eindeutig bestimmt, wobei & eine abzählbar 
unendliche Menge verschiedener Werte aus dem. Intervall [0, 2x] durchläuft. 
Dem Problem, eine zweidimensionale Verteilung durch die Verteilungen der Pro- 
jektionen auf gewisse abzählbare Mengen von Geraden zu bestimmen, sind auch 
die Arbeiten von GILBERT [1] und Hrrpes [1] gewidmet. . 

Die Sätze 4.6.1 bis 4.6.3 lassen sich offenbar leicht auf Zufallsvektoren mit mehr 
als zwei Dimensionen verallgemeinern. Eine ausführliche Theorie der: charak- 
-teristischen Funktionen findet der Leser im Buch von Lukacs [5]. 


4.7. Erzeugende Funktionen 


Bei der Untersuchung von Zufallsvariablen, die ausschließlich ganzzahlige Werte 
k=0,1,2,... annehmen, ist es vorteilhaft, an Stelle der charakteristischen Funk- 
tionen erzeugende Funktionen zu benutzen. X sei eine Zufallsvariable, und es sei 


=PX=k (k=0,1,2,...) 
mit YVp =1. 
% 
Definition 4.7.1. Die durch 
y)= ms (-IZs<i) (4.7.4) 
% 
definierte Funktion y(s) nennen wir die erzeugende Funktion der ganzzahligen 


Zufallsvariablen X. 
Wir bemerken, daß y(1) = p =1 ist; also ist die Reihe auf der rechten 


& 

Seite von (4.7.1) im Intervall |s|< 1 absolut und gleichmäßig konvergent. Die 
erzeugende Funktion ist dann stetig. Sie bestimmt eindeutig die Wahrschein- 
lichkeitsverteilung der Zufallsvariablen X, d.h. die Zahlen 7,, da y(s) sich nur 
auf eine Weise als Potenzreihe der Form (4.7.1) darstellen läßt. 
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Beispiel 4.7.1. Die Zufallsvariable X habe eine Binomialverteilung: . 


n 
= (run (k=0,1,...,n). 
Dann ist i 
ä fi 
vo)=Y | ) (ps)e(1 — pt = (ps + q)*. (4.7.2) 
k=0 ’ 
Beispiel 4.7.2. Die Zufallsvariable X habe eine Poissonverteilung: 
Ze 
m (k = 0,1, ...). 
Dann ist 
© k 
vi) = I et nn erehs — e-A1-5), (4.7.3) 
k=0 : 


Existiert das /-te Moment der Zufallsvariablen X, dann läßt es sich mit Hilfe 
der Ableitung der erzeugenden Funktion an der Stelle s = 1 bestimmen. Wir er: 
halten nämlich 


ve) = Ahmet, 
k 


y"(s) = 26h — 1)9,8$F72, 
also 
v’(l) = hp =E(X), 
v0) = Ih — Ups = iX) — BR). 


Daraus ergibt sich 
EX) =yv'(i)+y(l). 


Für erzeugende Funktionen gilt ein zu dem Satz 4.4.1 analoger Satz. Sein Beweis 
ist elementar. 


4.8. Aufgaben und Ergänzungen 


1. Man bestimme die charakteristische Funktion der Zufallsvariablen, deren Dichtefunktionen 
die folgende Form haben: 


0° für la} >a>0, 
Jf)=ja-i 
a? 


für |e|<ae; 


1 
2sin® — ax 


b) fe) = 


scax? 
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Hinweis. Vergleiche hierzu die Herleitung der Formel (5.10.10). 
2. Man zeige, daß die Funktion 
pt) = exp(—|t]"), 
wobei r> 2 ist, keine charakteristische Funktion darstellt. 
3. Eine beschränkte und stetige Funktion 9 (f) ist charakteristische Funktion einer gewissen 


Verteilungsfunktion dann und nur dann, wenn 9(0) =1 gilt und die Funktion 


A A 
ymA)=[ [ pl wert) dtdu 
00 ; 


für alle reellen x und alle A > 0 reell und nichtnegativ ist (Cramer [5]). 


4. Die charakteristische Funktion einer Zufallsvariablen X sei p(f). Man beweise: 
a) Ist X stetig, so ist lim p{f)=0. 


too 


b) Ist X diskret, so ist lim sup Ip dj=1. 


to 
5. Man beweise die folgenden Behauptungen: 


a) Ist p(t) charakteristische Funktion einer gewissen Zufallsvariablen, so gilt das gleiche 
auch für |p(t)]?. - 

b) Ist 9(f) charakteristische Funktion einer Zufallsvariablen mit stetiger Verteilungs- 
funktion, so hat |p(f)]? die gleiche Eigenschaft. 


6. Man zeige, daß die charakteristische Funktion einer Zufallsvariablen X dann und nur dann 
“ reell ist, wenn X eine symmetrische Verteilung bezüglich 0 besitzt. 
7. a) Man zeige, daß für jede charakteristische Funktion @(f) die Beziehung 
1— Regp(2t) <4{1 — Rep(i)) 
gilt. 
b) Hieraus ist die Beziehung 
1-[p@y? Salt — |p)l) 
herzuleiten. 


8. Man zeige, daß die Momente der Ordnungen 1, 2, ..., 2leiner Zufallsvariablen X existieren, 
wenn die charakteristische Funktion p(t) von X die Ableitung gerader Ordnung g(2D (0) 
besitzt (CRAMER [2]). 


Hinweis. Man beweise unter Verwendung symmetrischer Ableitungen die Beziehung 


o ihe _ o-ihe \2l 
Fe) — lim f I) dF (a) 
h>0 —© 
© (sinke\2l 
= (—1}! lim ’& .) ÄF(«). 
I —-o 


9. a) Man zeige (Zvemuxo [1]), daß 


& , 
lim. Jzdre) Eh 


ATX —& 
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gilt, wenn die charakteristische Funktion @(f) der Verteilungsfunktion F(x) au der 
Stelle 0 differenzierbar ist. Die linke Seite der obenstehenden Gleichung nennen wir den 
verallgemeinerten Mittelwert der Zufallsvariablen X. 


b) Man zeige (Prrman [2]), daß die charakteristische Funktion $(f) an der Stelle 4 = 0 
differenzierbar ist, wenn der verallgemeinerte Mittelwert einer Zufallsvariablen X 
existiert und die Beziehung 


imaP(|X|>a)=0 


>00 
gilt. 
c) Man zeige, daß 
= cos nt 
y)=0 —— 
rn=0 2, Wem” 
n-F0, +1, +2, 


wobei Ü eine geeignet gewählte Konstante bedeutet, die charakteristische Funktion 
. einer gewissen Zufallsvariablen ist, die keinen Erwartungswert besitzt; man zeige 
ferner, daß dann g(f) differenzierbar ist. 


10. Man beweise den Satz 3.2.1. 
Hinweis. Unter Verwendung der Ungleichung (3.4.5) zeige man, daß 


lim Pr rt =0 
k>oo 


gilt. Anschließend zeige man, daß für |i]| < r die Reihe 
oo 


PO I TE dir 


konvergent ist. Schließlich setze man eine analytische Fortsetzung an, um zu zeigen, daß 
- diese Reihe für beliebige # konvergiert. 


11. Man zeige, daß die charakteristischen Funktionen 9, (f), 9,(f) und 9, (£) der Gleichung 
LZn) Pl) = Pıll) Pl) 
genügen können, obwohl @, (ft) und @,{f) nicht identisch gleich sind. 


12, a) Man beweise den Satz (Bocuwer [1]): Ist x, Sprungstelle der Verteilungsfunktion 
F(«) und ist Fix, +0) — Fa) = pP, so gilt 


T 
1 i 
p an fe“ pP) di, 
>00 
T 


wobei p(t) die charakteristische Funktion der Verteilungsfunktion F(«) ist. 
b) Man beweise (WIENER [2]), daß die Verteilungsfunktion. F(x) dann und nur dann stetig 


ist, wenn 
T 
lim 5 fi ()|di = 0 
T->o00o 27T 2 
-T 
gilt. 
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13. 


14. 


15. 


16. 


17. 


c) Aus dem eben Bewiesenen ist die Beziehung (Lorch und Newman [1]) 
T 


T 
i 1 i 1 ir. BR 
an gm | Wwoiae 5 | Er +0 Fell dt 
-T 


herzuleiten, wobei die x; die Sprungstellen der Verteilungsfunktion F(x) sind, wenn 
solche überhaupt existieren. 


Man beweise (Lüvy [1]}, daß für jede charakteristische Funktion o(£) die Beziehung 


7 
| 
Ki a IP) ?dt = (Fa; +0) — Fa) 
-T 


gilt, wobei die Summation sich über alle existierenden Sprungstellen «, der Verteilungs- 
funktion F(&) erstreckt, die der charakteristischen Funktion @(f) entspricht. 


Man zeige: Genüßt eine charakteristische Funktion o(t) für eine Folge von Punkten 
#0 (k=1,2,...), die gegen Null konvergiert, der Gleichung |[p(t,)| =1, so ist 
|pe@)|=1 identisch erfüllt. 


Man bezeichnet den Ausdruck 
mm =D kb — 1). (k— + 1)P%, 
k 


wobei = P(X=k) und Pr —=1 ist, als das faktorielle Moment der Ordnung I 
k 
der ganzzahligen Zufallsvariablen X. 


a) Man drücke m;;; mit Hilfe erzeugender Funktionen aus. 


b) Man ermittle die Beziehungen, die zwischen den faktoriellen und den gewöhnlichen 
Momenten bestehen. 

c) Welchen Ausdruck könnte man als das zentrale faktorielle Moment der Ordnung I 
bezeichnen? 


Man beweise, daß die zugehörige Verteilungsfunktion Momente beliebiger Ordnung be- 
sitzt, wenn die Reihe auf der rechten Seite der Definitionsgleichung (4.7.1) der erzeugenden 
Funktion für ein gewisses s, > 1 konvergent ist. 


Als Momentenerzeugende einer Zufallsvariablen X oder ihrer Verteilungsfunktion F(x) 
bezeichnen wir.den Ausdruck 


sa) — E(e'X), 
falls dieser endlich ist. 


&) Man schreibe den Ausdruck für g(f) für stetige und diskrete Zufallsvariable auf. 
b) Man bestimme die Funktion g(f) für die in den Beispielen 4.2.1 und 4.2.2 betrachteten 
Verteilungen. 


c) Wie lassen sich die Momente mit Hilfe der Momentenerzeugenden ausdrücken? Vgl. 
hierzu auch die Aufgaben 5.14.27 und 5.14.28. 


5. EINIGE WAHRSCHEINLICHKEITS- 
VERTEILUNGEN 


5.1. Die Ein- und Zweipunktverteilungen 


In den vorhergehenden Kapiteln haben wir verschiedene Wahrscheinlichkeits- 
verteilungen kennengelernt. In diesem Kapitel wollen wir uns eingehender mit 
einigen speziellen Wahrscheinlichkeitsverteilungen beschäftigen, welche große 
theoretische oder praktische Bedeutung besitzen. 

Wir beginnen mit der Einpunktverteilung. 

Definition 5.1.1. Die Zufallsvariable X hat eine Einpunktverteilung, wenn es 
einen Punkt x, gibt, für den 


PX=o)=1 (5.1.1) - 
ist. 

Wir sagen auch, daß bei dieser Verteilung die ganze Wahrscheinlichkeitsmasse 
in einem Punkt konzentriert ist. Offensichtlich weist eine Zufallsvariable mit Ein- 
punktverteilung eine ausgeartete Verteilung gemäß Definition 3.6.4 auf. 

Die Formel (5.1.1) gibt die Wahrscheinlichkeitsfunktion an. Die Verteilungs- 
funktion ist hier durch die Bedingungen 


[73 2 < ” j 
EN (5.1.2) 
1 für >, 


bestimmt. Die charakteristische Funktion dieser Verteilung erhalten wir aus 
(4.1.2): 


pt) = er. (5.1.3) 
Aus (4.2.4) erkennt man, daß 

m =% | 
und allgemein für jedes k 

m; =% 
ist. Daraus erhalten wir 

D(X)=m, -m=n-— a2 =0. 


Ist umgekehrt die Dispersion einer Zufallsvariablen X gleich Null, dann hat X 
eine Einpunktverteilung. 


160 5. Einige Wahrscheinlichkeitsverteilungen 


Nach Voraussetzung ist 
D(X)=E[X —- EX =0. (5.1.4) 


Da der. Ausdruck [X — E(X)]? niemals negativ ist, ist die Gleichung (5.1.4) nur 
dann erfüllt, wenn 


P(X—-E(X)=0)=1 oder PX=E(X))=1 


ist. Nach Formel (5.1.1) hat also die Zufallsvariable X eine Einpunktverteilung. 

Definition 5.1.2. Die Zufallsvariable X besitzt eine Zweipunktverteilung, wenn 
sie nur zwei Werte x, und x, mit positiver Wahrscheinlichkeit annehmen kann. Die 
Wahrscheinlichkeitsfunktion wird dann durch 


PX=z2)=»p PX=o,)=1-» (<p<i) (5.1.5) 
gegeben. 
Häufig betrachtet man den Fall x, =1 und », = 0. Statt der Formeln (5.1.5) 
haben wir dann 


PX=1)=p, PX=0)=1-p (<p<i). (5.1.6) 


Diese Verteilung wollen wir einfach Null-Eins-Verteilung nennen. 
Die charakteristische Funktion der Verteilung (5.1.6) wird durch 


gu Re (Det pet Hi p=i+ple—1) (6.17) 


gegeben. 
Aus (4.2.4) folgt für jedes k 


m—=P. E (5.1.8) 
Daraus erhalten wir 
D’(X)=m,-m=p—-P=p(il-—p). (5.1.9) 
Die Formeln (3.2.9) und (3.2.17) ergeben 


Mg = M; — 3m m, + 2m =p 3 +2 =pil— pl —2p), 


Ms _pi-mli-2p _ 1-2p 


er = eh 
Ze) 


- (5.1.10) 
Hz p*(ii — pm)? 


Bei p=05 wird y=0. Die Zufallsvariable X ist dann symmetrisch verteilt. 
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52. Das Bernoullische Versuchsschema. Die Binomialverteilung 


Im Beispiel 3.1.3 haben wir die Binomialverteilung kennengelernt. Bei dem fol- 
genden Versuchsschema, das nach BERNOULLI benannt wird, tritt eine Zufalls- 
variable X auf, die eine Binomialverteilung besitzt. 

Wir machen n Versuche. Das Ergebnis jedes Versuchs ist zufällig und kann 
entweder das Ereignis A (mit der Wahrscheinlichkeit p) oder das zu A kompiemen- - 
täre Ereignis A (mit der Wahrscheinlichkeit g=1-—p) sein. Die Ergebnisse 
der n Versuche sind unabhängig. Wir ordnen dem Ergebnis A die Zahl Eins und 
dem Ergebnis A die Zahl Null zu. Bei n Versuchen kann das Ereignis A genau 
k-mal (k =0,1,2,...,%) eintreten. Die Anzahl des Eintretens des A ren A 
bei » Versuchen sh eine Zufallsvariable X, die also die Werte k=0,1,...,n 
annehmen kann. 

Im Beispiel 3.1.3 wurde gezeigt, daß die Wahrscheinlichkeitsfunktion. dieser 
Zufallsvariablen durch 


PX=k) = (;) pl — pen (5.2.4) 


gegeben wird. Dann ist die Verteilungsfunktion der Binomialverteilung gleich 


Fa)=P(X < = () er, 


k<z 


wobei die Summation über alle nichtnegativen ganzen Zahlen, die kleiner als x sind, 
zu erstrecken ist. 

Wie wir sehen, stimmt für n =1 die Binomialverteilung mit der Null-Eins- 
Verteilung überein. Für » > 2 können wir die Binomialverteilung folgender- 
maßen aus der Null-Eins- Verteilung erhalten: 

Es seien X, (r =1,2,..., rn) unabhängige Zufallsvariable mit denselben Null- 
Eins-Vergeilungen. Die Wahrscheinlichkeitsfunktion der X, habe die Gestalt 


PX, =1)=p, PX=0)=-1-p. 


Wir betrachten die Zufallsvariable, die gleich der Summe der unabhängigen 
Zufallsvariablen X, ist: 


Kerr Sn, (5.2.2) 


X kann also die Werte k =0,1,...,» annehmen. Das Ereignis X —=% besteht 
darin, daß k der n Zufallsvariablen X, den Wert Eins und n — k Zufallsvariable 
den. Wert Null annehmen. Für ein gegebenes k kann dieses Ereignis auf i 2) ver- 
schiedene Arten realisiert werden. Wenn wir die Unabhängigkeit der X, beachten, 


11 Fisz 
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so erhalten wir (5.2.1). Aus den Formeln (5.1.7) und (5.2.2) finden wir als charak- 
teristische Funktion o(f) der Zufallsvariablen X: 


ed =l+ pet — yr. (5.2.3) 
Aus (4.2.4) erhalten wir die Momente dieser Verteilung, insbesondere 
my—=npd, Mm =np -+n(n — 19, (5.2.4) 


B=npil—p, w=npil —p)(l—2p). 
Wir finden also 


MER 0 200 u (5.2.5) 


npil —p) 
Die Formel für u, erhielten: wir schon auf anderem Wege in Beispiel 3.2.3. 
Beispiel 5.2.1. In Tabelle 5.2.1 sind die Binomialverteilungen für n = 20 und die p-Werte 
»=01l mM=03, 2-05 


angegeben. In der ersten Spalte der Tabelle sind die Werte k= 0, 1, ..., 20 aufgeführt, 
während in den übrigen Spalten die Wahrscheinlichkeiten angegeben sind, mit denen die 
Zufalisvariable diese Werte von k annimmt. Die Wahrscheinlichkeiten sind bis auf 0,0001 
genau angegeben. 


Tabelle 5.2.1. 


: PX=h PX=k 
9-01 P2 = 0,3 | P3 = 0,5 »,=0l | pP = 03 | Be 0,5 
0 0,1216 0,0008 _ 11 _ 0,0120 0,1602 
1 0,2702 0,0068 _ 12 —_ 0,0039 I 0,1201 
2 0,2852 0,0278 0,0002 13 _ 0,0010 0,0739 
3 0,1901 0,0716 0,0011 14 _ 0,0002 0,0370 
4 0,0898 0,1304 0,0046 15 _ _ 0,0148 
5 0,0319 0,1789 . 0,0148 16 — _ 0,0046 
6 0,0089 0,1916 0,0370 17 _ _ 0,0011 
7 0,0020 0,1643 0,0739 18 _ _ 0,0002 
8 0,0004 0,1144 0,1201 19 _ _ _ 
9 0,0001 0,0654 0,1602 20 _ _ _ 
10 ol 0,0308 0,1762 


In Abb. 5.2.1 sind die Verteilungen dargestellt. 
1 
Man sieht: Je weniger die Wahrscheinlichkeit p von Ey abweicht, desto sgtrincher ist 


die Verteilung; ‚gleichzeitig wächst aber auch die Streuung. Diese Ergebnisse waren zu 
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erwarten, wir hätten nur die Werte der Parameter u, und y für die betrachteten p-Werte 
und n =20 zu vergleichen brauchen. Diese aus (5.2.4) und (5.2.5) berechneten Parameter- 
werte sind in Tabelle 5.2.2 zusammengestellt. 


Pf 


030 5 -01 


0 k 


Abb. 5.21 
Tabelle 5.2.2. 
| 7, =01 2 = 0,3 pP, = 0,5 


= Yu, 1,34 2,05 2,24 
y 0,597 0,195 0,000 


Es seien X und Y zwei binomial verteilte, unabhängige Zufallsvariable, und es 
mögen die charakteristischen Funktionen der Variablen X und Y die Gestalt 


MM) =U + ple — 1%, 
92) = [1 + ple — 1) 
haben. Wir betrachten die Variable 
Z=X-+Y. 
Wegen der Unabhängigkeit von X und Y wird die charakteristische Funktion 


11* 
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von Z durch 


e)= [1 + pe — It" (5.2.6) 


gegeben. 
Wie man aus (5.2.6) erkennt, ist die Variable Z ebenfalls binomial verteilt. Sie 
ist gleich der Summe von #, + n,: unabhängigen Summanden, die alle dieselbe 
Null-Eins-Verteilung haben. Das ist der sogenannte Additionssatz für die Bino- 
. mialverteilung. 
In den Anwendungen untersucht man häufig die Verteilung der Zufallsvariablen 


X 


va 
N 


’ 


wenn X binomial verteilt ist. Die Zufallsvariable Y kann die Werte 


annehmen. Da die Wahrscheinlichkeit dafür, daß Ye Ei gilt, gleich der 
n 


_ Wahrscheinlichkeit dafür ist, dß X =k gilt, wird die Wahrscheinlichkeits- 
funktion der Zufallsvariablen Y durch die Formel (5.2.1) gegeben: 


P (7 — .) -PX=h= (7) ip". 


Unter Berücksichtigung der Formeln (4. 2. 15) und (5.2.3) sales wir für die 
charakteristische Funktion der Zufallsvariablen Y: 


. ü n - 2. ‘ 

ol) = f +» (er _ ı)| e (5.2.7) 
Die Momente erhalten wir aus der Formel (4.2.4) ; insbesondere ist 
n—i 1—-p) 

M=Pp M=-—+t pP, a= nn . .. (5.2.8) 

n N n. 

5.3. Das Poissonsche Versuchsschema. Die verallgemeinerte 

Binomialverteilung 


Poıissox betrachtete das folgende Versuchsschema: Man macht rn Versuche. Als 
Ergebnis des k-ten Versuchs (k=1,2,...,n) kann das Ereignis A mit der 
Wahrscheinlichkeit p, eintreten. Die Wahrscheinlichkeit des zu 4 komplementären 
Ereignisses A ist also gleich q« = 1 — 2. Die Ergebnisse der n Versuche sind un- 
abhängig. Im Gegensatz zum Bernöullischen Schema.brauchen hier in den ein- 
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zelnen Versuchen die Wahrscheinlichkeiten für das Eintreten des Ereignisses A 
nicht einander gleich zu sein. 

Wir ordnen dem Ereignis A die Zahl Eins und dem Treignis Z die Zahl Null zu. 
Die Anzahl der Fälle, in denen das Ereignis A bei n Versuchen eintritt, ist eine 
zufällige Veränderliche. Wir sagen, daß diese Zufallsgariable eine verallgemeinerte 
Binomialverteilung besitzt. 

: Eine Zufallsvariable Z, die eine geralibemeinerte Binomialverteilung besitzt, 
kann auch als Summe 


Z=h,Ht4-t+tZ, (5.3.1) 


dargestellt werden, wobei die Zufallsvariablen Z,(k =1,...,n) unabhängig sind 
und Null-Eins-Verteilungen mit den Wahrscheinlichkeitsfunktionen 


PZA=-1)=-m PA=-)=1-M 
haben. ns 

Die Formel für die Wahrscheinlichkeitsfunktion der Zufallsvariablen Z ist 
nicht so einfach wie die entsprechende Formel für die Binomialverteilung. Die 
Wahrscheinlichkeiten dafür, daß Z= r, finden wir, indem wir die Wahrscheinlich- 
keiten aller möglichen Anordnungen, die aus r Einsenund » — r Nullen bestehen, 
addieren. 

Beispiel5.3.1. Wir betrachten drei Ladungen Apfelsinen. Der Anteil der verfaulten (,‚fehler- 
haften‘‘) Apfelsinen betrage in der ersten Ladung 9, = 0,02, in der zweiten 9, = 0,05, in 
der dritten 2; = 0,01. Aus jeder Ladung greifen wir aufs Geratewohl eine Apfelsine heraus. 
Ergreifen wir eine gute Apfelsine, so schreiben wir die Zahl Eins hin, ergreifen wir dagegen 
eine verfaulte, die Zahl Null. Z,, Z,, Z, sind hier Zufallsvariable, die die Werte Eins bzw. Null 
annehmen, wenn wir aus der ersten, zweiten oder dritten Ladung eine gute bzw. eine schlechte 
Apfelsine herausgreifen. Diese Veränderlichen sind unabhängig, und es ist 


Piz, =1)=09, P(Z,=1)= 0,9, P(Z, = 1) = 0,9. 


Wir betrachten die Zufallsvariabe Z=Z, +2, +Z,. Sie kann die Werte r=0,1,2, 3 
annehmen, und wir berechnen der Reihe nach die Wahrscheinlichkeiten dafür, daß 
Z=r ist, wobei wir die Unabhängigkeit der Z,, Z,, Z, benutzen: ; 


P(Z=0) = P(Z, = 0)P(Z, = 0)P(Z, = 0). = 0,00001, 
PIZ=1)= P(Z, =0)P(Z = 0)P(Z, = 1) 
HPA, = PZ=1PZ,=9)+ PA, = Pa, =NPiZ,=0) 
= 0,001 67, 


PIZ=2) = P(Z, = 0)P(Z,=1)P(Z,=1) 
+ Pi = 1)P(,=0)P(,=1)+ P(4 =1)P(,=1)P(Z, = 0) 
= 0,07663, 
P(Z=3) = P(Z, = 1)P(Z, = 1) P(Z, = 1) = 0,92169. 
Hieraus folgt sofort P(Z=0) + PZ=1) + PZ=-9)+PZ=3=1. 
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Die Zufallsvariable Z, die durch die Formel (5.3.1) definiert ist, habe eine ver- 


“ allgemeinerte Binomialverteilung. Ihre charakteristische Funktion erhalten wir 


dann aus (5.1.7), wobei wir beachten, daß die Summanden Z, unabhängig sind: 


ei) -/I + let 1]. | (5.3.2) 
—i 


Um mit Hilfe der Formel (5.3.2) die ersten zwei Momente der Zufallsvariablen 
Z berechnen zu können, benutzen wir die Formel (4.2.4). Wir erhalten 


n N Rn n 
m =: M=NmtN 3Pım, (5.3.3) 
k=i1 k=1 u 


n 
4 = U Pr(l. — Pr). 
k=1 
Wie wir sehen, sind die Formeln (5.2.4) für m,, m, und u, Spezialfälle der ent- 
sprechenden Formeln (5.3.3). 


Beispiel 5.3.2. Für die Zufallsvariable Z aus dem Beispiel 5.3.1 berechnen wir den Mittel- 
wert und die Standardabweichung. 
Wir erhalten 


Ed)=em=(i1-m)+il-p)+(l— 2) = 2,2, 


s= Yn = Y0,0196 + 0,0475 + 0,0099 = 0,0770 » 0,28. 


54. Die Pölyasche und die hypergeometrische Verteilung 


A. In der Praxis trifft man häufig Verteilungen an, die sich in das sogenannte 
Pölyasche Schema bringen lassen. 

Stellen wir uns Folgendes vor: In einer Urne befinden sich 5 weiße und c 
schwarze Kugeln. Wir setzen b+e = N. Ausder Urne nehmen wir aufs Gerate- 
wohl eine Kugel heraus. Bevor wir die nächste Kugei nehmen, legen wir diese 
Kugel zurück und legen außerdem noch s Kugeln derselben Farbe wie die heraus- 
gegriffene in die Urne hinein. Das wiederholen wir n-mal. Wir bezeichnen mit X die 
Zufallsvariable, die den Wert k (k =0,1,...,n) annimmt, wenn bei » Ziehungen 
k-mal weiße Kugeln erscheinen, und wollen die Wahrscheinlichkeitsfunktion von 
X. bestimmen. 

Die Wahrscheinlichkeit dafür, daß k-mal nacheinander weiße Kugeln gezogen 
werden, ist gleich 


b(b + S)--[d + (k— 1)s] 
NN+S)--IN + kV’ 


Ebenso ist die Wahrscheinlichkeit dafür, daß zuerst k-mal nacheinander weiße 
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Kugeln und dann (n — %k)-mal nacheinander schwarze Kugeln gezogen werden, 
gleich 
b6+9)--1b+(k—Wslete + 9)--Ic+ m — k— Ns] 
NN + S)--IN + (n — Ds] 


Der letzte Ausdruck ist ebenfalls gleich der Wahrscheinlichkeit dafür, daß man k 
weiße und n — k schwarze Kugeln in irgendeiner Reihenfolge zieht. Die Reihen- 
folge des Ziehens von weißen und schwarzen Kugeln hat nämlich nur Einfluß auf 
die Faktorenanordnung des Zählers. Da man %k weiße und n — k schwarze 


Kugeln auf (%) verschiedene Arten anordnen (ziehen) kann, ergibt sich 


Prenet b(b +3)-[b+(k—Vslete+s).-Te+r —k—-Nel 
k NN +s)-[N+(n— Ds] " 


(5.4.1) 


Definition 5.4.1. Wir sagen, daß die Zufallsvariable X mit der durch die For- 
mel (5.4.1) gegebenen Wahrscheinlichkeitsfunktion eine Pölyasche Verteilung hat. 
Es sei nun 


Np=b, Ng=c, Na=s. 


Wie wir sehen, sind p bzw. q die Wahrscheinlichkeiten dafür, beim ersten Mal eine 
weiße bzw. schwarze Kugel zu erhalten. Die Formel (5.4.1) nimmt dann die Gestalt 


A ta).-[p+(k—Nalgg+ta) gr rn —k-Na] 
k 1-1 +a)--[1+m— 1a] 
(5.4.2) 
an. Offenbar ist 
B> () pp+ta)-Pptk—-Yalggta)-ltm—k— Na] _ 1 
vo \% i-d4+o)-[1+(r— Del 
(5.4.3) 


Wir berechnen die Momente erster und zweiter Ordnung. Das erste Moment 
wird durch die Formel 


B(X) = J'kP(X =h) 
b=0 . 


. ( > ) P+a)-TP+k-Nalgg ta) + nr —k— Na] 
d+a)-[1+m— Na] 


gegeben. Für /=k-—1 erhalten wir 


n— ) Pt) -(prlaggta)g+m-—-T— 2a] 
I (d+a)-[1 + (m — Dal 


’ 


ö n—1 
E(X)= pn | 
(5.4.4) 
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Wie man leicht bestätigt, ist der Ausdruck unter dem Summenzeichen in der 
letzten Formel die Wahrscheinlichkeit dafür, bei na — 1 Ziehungen !-mal weiße 
und (nr — I.— 1)-mal schwarze Kugeln zu erhalten, wenn das Ziehen der Kugeln 
nach dem Pölyaschen Schema erfolgt und die Urne zu Beginn b-++ s weiße und c 
schwarze Kugeln enthält, im ganzen also N +s Kugeln. Wegen der Beziehung 
(5.4.3) folgt daraus, daß die Summe auf der rechten Seite der Formel (5.4.4) 
gleich Eins ist, also 


E(X) = np. (5.4:5) 


Wir wollen jetzt das zweite Moment berechnen: 


E(X3) = FepX ze 


=npY&k 


k=1 


n— 1\ P+a)--[p+(k—Nalgg+a).--[Ig+ (nk —1)a] 
k—1 (1 +a)--[1 +(n — 1)a] " 


Wie vorhin setzen wir l=k— 1: 
EX) =np 2 049", ) 
& ee ee 
d+a)-[1 + m — Na] | 
2 Fi (* = ) @ta)-(p +la)gg + a). + m —1-2a] 
ı (1-+a)--[+(n — Dal 


2, era an nn Fam] 
N ++ m- 1a] 


=np(A+DB). 
Nach einfachen Umformungen erhalten wir 
_@+am 12m — 2 
a 1-+a 2 | r ) 
„etz terdDag-itmr da] ug 
(1 +2a).--[1 + (n — 1)a] 
2° = yet Pta-(ptlagg+ta)lg+ m -1—-Yal 
ı Ad+a-[1+(n— 1a] 


B= 


I=0 

(5.4.7) 
Der Ausdruck B ist identisch mit der Summe in der Formel (5.4.4), also ist 
B = 1. Wir bemerken weiter, daß der Ausdruck unter dem Summenzeichen in der 
Formel (5.4.6) gleich der Wahrscheinlichkeit dafür ist, daß .man bei n — 2 
Ziehungen nach dem Pölyaschen Schema r-mal weiße und (n — r — 2)-mal 
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schwarze Kugeln erhält, wenn die Urne zu Beginn 5 +2s weiße und c schwarze, 
also insgesamt N + 2s Kugeln enthält. Aus Formel (5.4.3) folgt also 


@+a(r-—1) 
1l-a " 
Wir erhalten schließlich 


A 


p+a(n—1) np +g-+na 
E(X?2) = +1 _  —, 5.4.8 
(&°) | a . ne np 12a (5.4.8) 
Unter Beachtung der Formel (5.4.5) erhalten wir 
1+na 
D2(X) = 5.4.9 
a 2 2 Sagen = (5.4.9) 


Das Pölyasche Schema findet Anwendung bei Erscheinungen, die sich wie an- 
steckende Krankheiten verhalten, bei denen also das Eintreffen eines Ereignisses 
(lies: eine Erkrankung) die Wahrscheinlichkeit der Ansteckung erhöht. 

Im Pölyaschen Schema kann s auch negativ sein, denn da die Ungleichungen 


b+(k—1)s>1 sowe c+n— k—1s>1 
gelten müssen, genügt %k der Doppelungleichung 


max (0, —) = 3 = min ı). 
E) 8 


B. Die Größen N, b und c sollen so gegen Unendlich streben, daß 


=.const (5.4.10) 


bleibt. Dann ist g—=1— p ebenfalls konstant. Wir setzen außerdem noch vor- 
aus, daß lim«@ = 0 ist. Das ist insbesondere dann erfüllt, wenn s konstant bleibt 


N>oo ; 
und N unendlich wird. Aus den Formeln (5.4.1) und (5.4.2) folgt dann 


imPX=k= le ) prgek, (5.4.11) 


No 


Wir erhielten also: 
Satz 5.41.Istfür N=1,2,... die Gleichung (5.4.10) erfüllt und ist un: a0, 


dann: konvergiert die Wahrscheinlichkeitsfunktion einer Zufallsvariablen X, as 
eine Pölyasche Verteilung besitzt, gegen die Wahrscheinlichkeitsfunktion der Bino- 
mialverteilung. 


€. Ein Spezialfall der Pölyaschen Verteilung ist die hypergeometrische Verteilung. 
Bei dieser Verteilung ist s = —1, wir geban also einfach die gezogene Kugel vor 


{ 
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der Wahl der nächsten nicht zurück. Die Wahrscheinlichkeitsfunktion der hyper- 


geometrischen Verteilung erhalten wir aus der Formel (5.4.2), wenn wir « = — & 


setzen. Für Werte von k, die der Ungleichung N 
max (0,n — Ng)<Sk< min (n, Np) 
genügen, finden wir 


Brenaj) rear nr) 
k NN —- 1). (N—-n+1) 


len 
Abm), (5.4.12) 
N 
() 
Der Mittelwert E(X) beträgt hier »p, und die Formel für die Dispersion nimmt 
folgende Gestalt an: 


2 en % 
D(X) = vi npg. (5.4.13) 

Die hypergeometrische Verteilung findet Anwendung bei der Qualitätskontrolle 
der Massenproduktion. Es bestehe z. B. eine Warenladung aus 5 guten und N — b 
=c fehlerhaften Exemplaren. Das gute Exemplar spielt hier die Rolle einer 
weißen, das fehlerhafte die Rolle einer schwarzen Kugel, an die Stelle der Urne 
tritt die Warenladung. Zur Qualitätskontrolle greifen wir aus der Ladung n 
Exemplare aufs Geratewohl heraus und legen vor der Wahl des nächsten das eben 
gewählte Exemplar nicht in die Ladung zurück. Wären die Größen 5 und ce bekannt, 
dann könnte man die oben erhaltenen Formeln anwenden und die Wahrschein- 


lichkeit dafür berechnen, daß sich unter den n herausgegriffenen Exemplaren k 


gute befinden. In der Praxis sind jedoch die Zahlen 5 und c nicht bekannt, und die 
Untersuchung der Qualität einer gewissen Anzahl von Exemplaren dient eben zur 
Abschätzung dieser unbekannten Zahlen. Mit Problemen dieser Art werden wir 
uns im zweiten Teil des Buches beschäftigen. : 


5.5. Die Poissonsche Verteilung 


In Beispiel 4.2.1 haben wir eine Zufallsvariable X mit einer Poissonschen Ver- 


teilung betrachtet. Wir stellen nun die wichtigsten Eigenschaften einer solchen 


Zufallsvariablen zusammen. 
Sie kann die Werte r = 0,1, 2,.... annehmen. Ihre Wahrscheinlichkeitsfunktion 
ist durch 


PX=rn= Ka (5.5.1) 
Tr 
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bestimmt, wobei A eine positive Konstante ist. Die charakteristische Funktion 
dieser Zufallsvariablen hat nach Formel (4.2.6) die Gestalt 


pi) = een, 
Die Formeln (4.2.7) bis (4.2.9) ergeben 
m=4h, m=iAH+Ll, Bm. 


Die Wahrscheinlichkeitsfunktion (5.5.1) kann man als Limes von Wahrschein- 
lichkeitsfunktionen der Binomialverteilung erhalten. Um das zu zeigen, beweisen 
wir den sogenannten Poissonschen Satz (vgl. Poıssox [1]): 


Satz 5.5.1. Die Zufallsvariable X, habe eine durch die Formel 
n! 
PX=rn = pP (l- pr (5.5.2) 
r!(n — r)! er 
_ gegebene Binomialverteilung, wobei r die Werte 0,1,...,n annehmen kann. Gilt 
für n=1,2,3,... die Beziehung!) j j 
y } 
pam, (8.5.3) 
N 


wobei A>0 eine Konstante ist, dann ist 


imPX,=rn= Eh (5.5.4) 
° r! 


No 


Da der Mittelwert der Binomialverteilung gleich »7 ist, besagt die Bedingung 
(5.5.3), daß der Mittelwert der Binomialverteilung sich bei wachsendem » nicht 
ändert. 


Beweis. Wir formen (5.5.2) folgendermaßen um: 


PX.=n= n!ı AV /, AT: 
5 r!(n — r)!\r n% 


A (i jelmai, 1 


r! N n" 1.) 
n 


1) Der Satz gilt auch dann noch, wenn wir die Relation (5.5.3) durch limnp =4 ersetzen. 
N>0O 
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Unter Berücksichtigung von 


Be, 1-(1-2)--(1-77-) 
lim (' _ .) —=e”* sowie lim ul en eh rd 1 
N 


= 
n 
erhalten wir die Beziehung (5.5.4). 
Auf den Satz 5.5.1 kommen wir noch in 6. 9. C zurück. 

. Abb. 5.5.1 stellt die Wahrscheinlichkeitsfunktion der Binomialverteilung für 
nr—=5und p=03, ao A=np=1,, und die Wahrscheinlichkeitsfunktion 
der Poissonverteilung mit demselben Mittelwert: A = 1,5 dar. In Abb. 5.5.2 sind 
graphische Darstellungen der gleichen Wahrscheinlichkeitsfunktion für n = 10 
und p = 0,15, also wieder für A = 1,5, angegeben. Wäre n noch größer (z.B. 
gleich 100), dann würden die graphischen Darstellungen der Binomial- und der 


n>X 


Poissonverteilung fast vollständig übereinstimmen. 


PfX=r} 


037° 


02 


01 


PiX=r} 


Binomialverteilung st, . 
; Binomialverteilung ° 


Poissonverteilung 
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61 
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Abb. 5.5.1 : Abb. 5.5.2 


Häufig deutet man die Poissonsche Verteilung als die Verteilung einer Zufalls- 
variablen, die wohl viele verschiedene Werte (die Anzahl r ist groß), aber mit 


kleinen Wahrscheinlichkeiten (die Wahrscheinlichkeit p = — istklein) annimmt. 
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Deshalb nennt man manchmal die Poissonsche Verteilung das Gesetz der kleinen 
Zahlen; diese Bezeichnung ist jedoch, wie zwei: Beispiele zeigen werden, un- 
begründet. 

BoRTKIEwicz [1], der sich init der Untersuchung der Poissonschen Verteilung 
befaßte, bringt einige empirische Beispiele von zufälligen Ereignissen, auf die diese 
Verteilung angewandt werden kann. Wir zitieren eines davon: 


Beispiel 5.5.1. Aus den Angaben der preußischen Armee hat BoRTkIEwıcz die Anzahl der 
Soldaten in 10 Kavallerieregimentern berechnet, die in einem Zeitraum von 30 aufeinander- 
folgenden Jahren infolge eines Huftritts starben. 

Als zufälliges Ereignis betrachten wir hier, daß in einem Regiment im Laufe eines J: abras r 
Leute durch Huftritte umkamen. (r = 0,1,2,...). Es liegen 10: 20 = 200 Beobachtungen 
vor, da 10 Regimenter im Laufe von 20 Jahren beobachtet wurden. 

BorrkIzwıcz beobachtete nun die in Tabelle 5.5.1 angegebenen Häufigkeiten der Werte 
vonr. 


Tabelle 5.5.1. Die Häufigkeit der Todesfälle an den Folgen eines Huftritts 


gr | 0 | 1 | 2 | 3 | 4 
Häufigkeit 0,545 0,325 0,110 0,015 0,005 
Walrschöinlichkeit 0,544 0,331 0,101 0,021 0,003 


Aus der mittleren Zeile dieser Tabelle berechnen wir den Mittelwert 
E(X) = 0: 0,545 -H 1: 0,325 + 2- 0,110 +3 - 0,015 + 4 - 0,005 = 0,61. 


Wir berechnen die entsprechenden Wahrscheinlichkeiten P(X =r) für die Poissonverteilung 
mit A = 0,61. (Diese Wahrscheinlichkeiten liest man gewöhnlich .aus den Tafeln für die 
Poissonverteilung ab. Als Beispiel wollen wir aber die Wahrscheinlichkeiten unmittelbar 
berechneri.) Wir erhalten 


P(X = 0) = e70,#1 — 0,544, 
P(X = 1) = 0,61 0.1 = 0,331, 


# 0, 61?e —0,61 
PX=29- 9,101, 
2! 
0,613 —0,61 
PX =3)— ei — 0,021, 
.  0,614e-0,01 
PRr=4= a — 0,008. 


Diese Werte sind in der unteren Zeile der Tabelle 5.5.1 aufgeführt. Wie wir sehen, unter- 
scheiden sich die Wahrscheinlichkeiten nur wenig von den entsprechenden Häufigkeiten. 
Zu diesem Beispiel kehren wir noch einmal zurück (Beispiel 12.4.3). 


In vielen physikalischen und technischen Problemen hat man es mit Verteilungen 
zu tun, die Annäherungen an die Poissonsche Verteilung sind. Wir bringen hier 
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ein Beispiel aus der Physik. In Kapitel 8 werden wir uns näher mit der Deutung 
des Mechanismus der zufälligen Erscheinungen, die der Poissonschen Verteilung 
unterliegen, befassen. 


Beispiel 5.5.2. Wir zitieren hier die Ergebnisse der berühmten Rutherfordschen und 
Geigerschen Versuche. Die Physiker RUTHERFORD und GEIGER beobachteten die Anzahl 
der &-Teilchen, die von radioaktiven Substanzen in n = 2608 Zeitabschnitten von 7,5 Sekun- 
den emittiert wurden. 

In Tabelle 5.5.2 bedeutet 2; die Zahl der Zeitabschnitte, in der die Anzahl der emittierten 
«-Teilchen ö betrug. Die durchschnittliche Anzahl 4 der emittierten «-Teilchen in einem Zeit- 
abschnitt von 7,5 Sekunden beträgt i 


mi _ 397 
R 
Wir schreiben 
MO 
yet 


i 


und berechnen die Werte np,. Der Leser beachte die gute Übereinstimmung der zweiten Spalte 
mit der dritten in Tabelle 5.5.2. 


Tabelle 5.5.2. 


ö n; np; 
0 57 54,399 
1 203 210,523 
2 383 407,361 
3 525 525,496 
4 532 508,418 
5 408 393,515 
6 273 253,817 
7 139 140,325 
8 45 67,882 
9 27 29,189 

10 16 17,075 

2608 2608,000 


Ebenso wie für die Binomialverteilung kann man für unabhängige Zufalls- 
variable mit Poissonverteilungen einen Additionssatz beweisen. 

Die unabhängigen Zufallsvariablen X, und X, mögen die entsprechenden 
Poissonschen Verteilungen 


RR 
P(X,=r)=-teh, 

r! 
P(X,=r)= a er’ 
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(r = 0,1, 2, ...) haben. Wir betrachten die Summe 
X=X,-+X,. 


Laut Formel (4.2.6) haben die charakteristischen Funktionen der Zufallsvariabien 
X, und X, die Form 


Zen, 
p(t) = erlet-D, 


Auf Grund der Unabhängigkeit der Zufallsvariablen X, und X, ist die charak- 
teristische Funktion der Zufallsvariablen X gleich 


(0) (f) — eıtir) (e® 3) j (5.5.5) 


Die Formel (5.5.5) gibt die charakteristische Funktion einer nach Po1ssox 
verteilten Zufallsvariablen mit dem Mittelwert A, +4, an. Das ist der Additions- 
satz für unabhängige Zufallsvariable, die Poissonverteilungen besitzen. 

Rarkow [1] hat gezeigt, daß auch die Umkehrung des Satzes gilt: Sind die 
Zufallsvariablen X, und X, unabhängig und hat X = X, + X, eine Poissonsche 
Verteilung, so weist auch jede der Variablen X, und X, eine Poissonsche Verteilung 
auf. 

Der Satz von Raıkow gilt für beliebig viele unabhängige Zutfallsvariable 
DD RE. 


5.6. Die Rechtecksverieilung 


A. Die einfachste stetige Verteilung ist die Rechtecksverteilung. In Beispiel 4.1.2 
haben wir einen ‚Spezialfail der Rechtecksverteilung betrachtet. Die allgemeine 
Definition ist folgende: 


Definition 5.6.1. Die Zufallsvariable X hat eine Rechtecksverteilung oder ist 
gleichverteilt, wenn ihre Dichte f(x) folgendermaßen gegeben ist: 


1 für a—ı <sesa+h, wobeiaundh(h> 6) 
fx) =*!2h gewisse Konstante sind, (5.6.1) 
0 sonst. j 


Die Verteilungsfunktion F (x) dieser Zufallsvariablen X ist dann gleich 


[0 für z<a—h, 
Ber; 
li x — (a —h) P 
Fi; | = 5% für 0 hszesath, 
| a—h 
li für >a-h. 


(5.6.2) 
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Die charakteristische Funktion der Zufallsvariablen X wird durch die Formel 


fe + (+1) _ gile-n) 
it Ta dia — öltla— 
ve) = [erde - 2 
2h 2hlit|,.. 2% it 
ah 
„sinih (5.6.3) 
th 
gegeben. Die Momente erhalten wir unmittelbar aus der Formel 
Ta Ayk+ k+1 
1 
BR an - N (5.6.4) 
k+1 
Insbesondere finden wir 
3a? + R2 Bi 
m=4a m=- 
3 
Daraus ergibt sich 
2 
HM = m, — mi = = (5.6.5) 


Wir können die Zufallsvariable X so linear transformieren, daß die transfor- 
mierte Zufallsvariable Y im Intervall [0,1] gleichverteilt ist. Es sei 


v- X— (a — N 
2h 
Die Dichte f, (y) der Zufallsvariablen Y ist dann.in folgender Weise bestimmt: 


(5.6.6) 


1 im Intervall [0,1], 
hy) = AM 10,11 
sonst. 


Diese Rechtecksverteilung haben wir schon in 4.1.2 betrachtet. Die Dichte der 
Verteilung ist in Abb. 5.6.1 dargestellt. 


Abb. 5.6.1 
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B. Bei statistischen Problemen stößt man häufig auf Rechtecksverteilungen. 
Bemerkenswert ist die Tatsache, daß die Zufallsvariable Y = F#(X) im Intervall 
[0,1] gleichverteilt ist, wenn die BE F x) der Zufallsvariablen X 
stetig ist. 

In der Tat, jedem unendlichen Werteintervall —o<ÄSzx der Zufalls- 
variablen X entspricht eine Wertemenge der Zufallsvariablen Y, die im Intervall 
0<Y’=zsy=[f(x) enthalten ist. 

Andererseits entspricht auf Grund der Voraussetzung, daß die Verteilungs- 
funktion F (x) stetig sein soll, jedem Wert 0<y= 1 mindestens ein Wert von x, 
der die Beziehung 


y=Fl@k)=P(X <a) (5.6.7) 


erfüllt. Die Transformation (5.6.7) braucht aber nicht eineindeutig zu sein, da die 
Urbilder F-!(y) gewisser y Intervalle sein können, in. denen die Verteilungsfunk- 
tion F(x) konstant ist. Hier können wir für ein gegebenes y als x = Fri(y) 
irgendeinen x-Wert aus dem Intervall wählen, in dem die Verteilungsfunktion 
F (x) konstantist, und für jeden derartigen Wert von x erhalten wir dann F[F-1(y)}' 
—y. Insbesondere können wir für x = F!(y) den kleinsten x-Wert wählen, 
für den diese Gleichung erfüllt ist. i 

Wir bezeichnen mit F,(y) die Verteilungsfunktion der Zufallsvariablen Y und 
erhalten 


© äüryso, 
Fı(y) =P(F(X) <y) =4P(X <F(y)) = FIF(y)) =y füro<y<i, 
1 füryzil. 


Aus diesen Formeln folgt 


1 für O<ys1mW, 
Fy)=hW) = I ur 
sonst. 


5.7. Die Normalverteilung 
In Beispielen haben wir schon vielfach normal verteilte Zufallsvariable betrachtet. 
Nun wollen wir die allgemeine Form der Normalverteilung untersuchen. 


Definition 5.7.1. Wir sagen, daß die Zufallsvariable X normal verteilt ist. 
wenn ihre Dichte f(x) durch 


1 (x — m)? Er 
I@) = | wer (s > 0) (5.7.1) 


gegeben ist. 


12 Fisz 
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Zuerst wollen wir nachprüfen, ob die durch (5.7.1) gegebene Funktic.ı eine 
Dichte ist. Zu diesem Zweck transformieren wir X folgendermaßen: 


yel em. (5.7.2) 
[03 
Wir erhalten 
ne 
I) = ” (5.7.3) 


7 


Da die durch (5.7.3) dargestellte Funktion eine Dichte ist (siehe 2.9), erhalten 


wir also 
© . j {+} A 
ER N - eu 
ee u 
o V2r 20° V2r 


Die charakteristische Funktion p(t) der Zufallsvariablen Y wurde schon in 
Beispiel 4.2.2 berechnet: / 


Unter Benutzung der Gleichungen (4.2.14), (4.2.15) und (5.7.2) erhalten wir 
für die charakteristische Funktion der Zufallsvariablen X den Ausdruck 


9%() = exp (im _ .) (5.7.4) 


Aus (5.7.4) und (4.2.4) erhalten wir für. die Momente 
mem my=ertn, Mo. (5.7.5) 


Wie man aus den Gleichungen (5.7.5) sieht, lassen sich die Konstanten m und 
o, die in der Formel (5.7.1) vorkommen, leicht deuten: m ist der Mittelwert der 
Zufallsvariablen X und o ihre Standardabweichung. Die Form der Dichtekurve 
einer normalen Zufallsvariablen hängt vom Wert von o ab. Diese Kurven wollen 
wir im folgenden kurz Normalkurven nennen. Die Abhängigkeit von o zeigt 
Abb. 5.7.1: Die drei Normalkurven haben denselben Mittelwert m = 0, aber 
verschiedene Standardabweichungen, nämlich o=1, 0=05 und 0 =0,2. 

Die Normalverteilung mit dem Mittelwert m und der Standardabweichung o 
werden wir mit N (m; o) bezeichnen. 

Wegen der Symmetrie der Normalkurve bezüglich des Mittelwertes m ver- 
schwinden alle ungeraden zentralen Momente: 


Maryı =0 für jedes k. (8.7.6) 
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Man zeigt leicht, daß 
Hy = 1:3. (2k — 1)0” (5.7.7) 


ist. Für a =1 ist die Formel (4.2.13) ein Spezialfall der Formel (5.7.7). 

Für die Normalverteilung sind sehr genaue Tafeln vorhanden, die man bei 
Rechnungen benutzt. Gewöhnlich interessiert uns die Wahrscheinlichkeit dafür, 
daß die normale Zufallsvariable X einen Wert annimmt, der sich vom Mittelwert 
m — E(X) absolut genommen um mehr als Ac (A >0) unterscheidet, d.h. um 


Abb. 5.7.1 


mehr als ein gegebenes Vielfaches der Standardabweichung. Diese Wahrschein- 
lichkeit, ausgedrückt als Funktion von 4, finden wir in den Tafeln für die Normal- 
verteilung, in denen die Werte des Integrals j 


- Zu 

RN N e ?2dy 

va). 
2 
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tabelliert sind. In der Tat, es ist 


P(X —m|> %o) (0 


>) NE 

[02 \ co 
Wir können auch fragen, wie groß die Wahrscheinlichkeit dafür ist, daß X 

um ein gegebenes Vielfaches Ac der Standardabweichung größer ist als der Mittel- 


wert, d.h. wie groß die Wahrscheinlichkeit P(X > m -+-o) ist. Wir erhalten 


j © 
BR 
PrSsHserrsnte e 2 dy. 
2n 
4 


Beispiel 5.7.1. Die Zufallsvariable X habe die Verteilung N (1;2). Gesucht ist die Wahr- 
scheinlichkeit dafür, daß X absolut genommen größer als 3 ist. 
4 


Wir führen die normierte Zufallsvariable Y = ein und erhalten 


PIXI> 3) - Per+1>9=?(|7+5)> 3) 


L*., 8 {..3 
-e(r+4<-S)+o(rried) 
=-P(IF<-)+P(F>1). 


Da Y eine normierte, nach N (0; 1) verteilte Zufallsvariable ist, gilt 


a 1 39: 
Pr <-2)= — | e ?dt= — | e ? dir 0,083, 


Ihr = 


= 2 
1 a 
PY>1 = — e 2 dtz 0,159. 
y2r 
1 


Die Werte dieser Integräle lesen wir aus den Tafeln für die Normalverteilung ab, und wir er- 
halten schließlich 


P(|X| > 3) = 0,182. 


Den Tafeln für die Normalverteilung entnehmen wir, daß für eine nach N (m;o) 
normal verteilte Zufallsvariable X die Beziehungen 


P(X—-m|>o) » 0,3173, 
P(|X — m| > 20) x» 0,0455, 
" PX — m| >30) » 0,0027 
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erfüllt sind. Aus diesen Gleichungen erkennt man, daß die Normalverteilung in 
der Umgebung ihres Mittelwertes stark konzentriert ist. Die Wahrscheinlichkeit, 
daß sich der Wert von X vom Mittelwert absolut genommen um mehr als 3o 
unterscheidet, ist kleiner als 0,01. Wegen dieser Eigenschaft der Normalverteilung 
wenden viele Statistiker häufig die sogenannte .Drei-Sigma-Regel an. Nach dieser 
Regel ist in einer beliebigen Verteilung die Wahrscheinlichkeit dafür, daß die 
absolute Differenz zwischen der Zufallsvariablen und ihrem Mittelwert größer als 
30 ist, sehr klein. Diese Regel sollte man aber nicht kritiklos anwenden, denn 
nach der Tschebyscheffschen Ungleichung weiß man tatsächlich nur, daß für eine 
beliebige Zufallsvariable X 


i 1 
P(IX— m! aan 


ist. Die Drei-Sigma-Regel kann man also nur auf Verteilungen anwenden, die sich 
nicht bedeutend von der Normalverteilung unterscheiden. Es müssen also fast 
symmetrische Verteilungen sein, die ihr Maximum in der Nähe des Symmetrie- 
mittelpunktes haben. 

Für die Normalverteilung gilt ebenfalls ein Additionssatz. In der Tat, X und Y 
seien unabhängige Zufallsvariable, und X sei nach N (m,;0,), Y nach N (my; 05) 
verteilt. Die charakteristischen Funktionen dieser Verteilungen sind 


1 
9,() = exp (mit Hd — 5 eu), 


9,(f) = exp (mi _ 5 a a). 


Wegen der Unabhängigkeit von X und Y hat die Zufallsvariable Z=X-+Y 
die charakteristische Funktion 


p(t) =exp Im. + m,)it — 5 (+ ae. (8.7.8) 


Der Ausdruck (5.7.8) ist die charakteristische Funktion der Normalverteilung 


N (m, + ms; Vo? + e), was zu beweisen war. 


CRAMER [4] hat gezeigt (vgl. Aufgabe 5.14.12), daß auch die Umkehrung des 
Satzes gilt: Sind X, und X, unabhängig und hat die Zufallsvarioble X = X, -+ X, 
eine Normalverteilung, so ist auch jede der Variablen X, und X, normal verteilt. 

Der Satz von ÜRAMER gilt für beliebig viele unabhängige Zufallsvariable. 

Neben dem Satz von CRAM£r kennt man viele Sätze, die die Normalverteilung 
charakterisieren. Einen hiervon werden wir in 9.5.C angeben. Hier führen wir den . 
Satz von SKITOWITscH [1] an: Zs seien X,, X, ..., X„ unabhängig, und sie mögen 
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sämtlich die gleiche nicht ausgeartete Verteilung aufweisen. Dann ist die Unab- 
hängigkeit.der durch die Formeln 


L=uX, +9%, + +0mX,, 
L,=bX, +6X%,+ + 6.X, 


definierten Zufallsvariablen L, und L, mit 


n n 
Lab; =0, (a; 5,)2 #0 
je1 j-1 
notwendig und hinreichend dafür, daß die Zujallsvariablen X,, X ..-., Xu normal 


verteilt sind. 

Für n =2 wurde dieser Satz von BERNSTEIN [4], Darmoıs [2] und GNEDENKO 
[10] bewiesen. Hier seien noch die Arbeiten von PöLyA [2] (vgl. Aufgabe 6.16.10), 
Kac [1], MArcınkıewicz [1] (vgl. Aufgabe 5.14.11), Linnık [1], LaHa [3] sowie 
Basv und Lau [1] erwähnt. 

Die Normalverteilung hat sehr große Bedeutung in Wahrscheinlichkeits- 
rechnung und Statistik. In der Natur und in der Technik trifft man häufig auf 
Verteilungen, die sich der Normalverteilung sehr nähern. Diese Erscheinung ist 
ein Untersuchungsgegenstand der Theorie der stochastischen Prozesse (siehe 8.9). 
Außerdem ist unter ziemlich allgemeinen Voraussetzungen die Normalverteilung 
die Grenzverteilung einer Summe von unabhängigen Zufallsvariablen, wenn die 
Anzahl der Summanden ins Unendliche wächst. Diese Fragen werden wir im 
nächsten Kapitel behandeln. 


5.8. Die Gammaverteilung 


In. den Anwendungen werden wir häufig eine Verteilung benutzen, die mit der 
Gammafunktion eng zusammenhängt, welche für 2 > 0 durch 


Fo) = [ #te"? de (5.8.1) 
0 R 


definiert ist. 

Es ist bekannt, daß das Integral (5.8.1) gleichmäßig bezüglich » konvergiert. 
Also ist 7’(p) eine stetige Funktion. Wenn wir (5.8.1) partiell integrieren, erhalten 
wir 


Top +) = [are da = [— eg] +Pp [are dx, 
6 6 
also 


To +1)=pTp). (5.8.2) 
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Insbesondere folgen aus der Gleichung (5.8.2) für 9 =n .(n eine natürliche Zahl) 
sukzessive die Gleichungen 


T’n+1)=nI(n), 


To)=r—-1)Tn—1), (5.8.3) 
re) =1rt) 
Da 
Ii)= fe dae=- [ee =1 
0 


ist, ergibt sich aus den Gleichungen (5.8.3) 
T’a+1l)=n!. (5.8.4) 
Wenn wir in (5.8.1) die Substitution y = 2 (> 0) ausführen, erhalten wir 
A 


a) - [wen di (5.8.5) 


ap 


0 


Die Gleichung (5.8.5) ist auch dann richtig, wenn a eine komplexe Zahl ist, 
a=b-+ ic, wobei b > 0. Das brauchen wir hier aber nicht zu beweisen. 
Es sei X eine Zufallsvariable mit der durch 


0 für <<0O, 
Im > 
a ap—le-b® für >00 20) 
Ip) 


gegebenen Dichte f(x); dabeiist 5>0 und p >0. Daß durch (5.8.6) eine Dichte 
gegeben wird, folgt unmittelbar aus (5.8.5), denn es ist 


fo de (tere 
R PP) 


und f(x) eine nichtnegative Funktion. 

Definition 5.8.1. Wir sagen, daß die Zufallsvariable X eine Gammaverteilung 
hat, wenn ihre Dichte durch (5.8.6) gegeben wird. 

Abb. 5.8.1 stellt die Dichte einer Gammarverteilung für p=1 und 5b=0,5 
dar (vgl. auch Abb. 9.4.1). 
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Wir wollen die charakteristische Funktion dieser Verteilung bestimmen: 


x x 
P, 
v0 = [erraan = , [reetwan. (5.8.7) 
T(p) 
=. e 


Da, wie schon erwähnt, die Gleichung (5.8.5) auch für «a =b-Hic,5 >0, richtig 
ist, ergibt sich also aus (5.8.7) 


br Ip) 1 


Ray (5.8.8) 


Abb. 5.8.1 


4 2 09 2 4 6 8 0 x 


Die Funktion g(t) kann man beliebig oft differenzieren. Ihre k-te Ableitung ist 
gleich 


-PPtDd-pHrh—h, 1 


BE ( _ a 
b 
Aus Formel (4.2.4) ergibt sich : 
PP) _PP+N- PEN. 


g® (f) für k=1,2,3,... 


ee m (5.8.9) 
Insbesondere erhalten wir 
p +1) p 
m = y m, = a ka = ch (5.8.10) 
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Beispiel 5.8.1. Die Zufallsvariable X habe eine Gammaverteilung, deren Dichte durch 


0 für s0, 
3 _ i 
2e® fürs>0O 


gegeben wird. Wie der Leser nachprüfen kann, erhalten wir diese Verteilung, wenn wir in der 
Formel (5.8.6) p=1 und b=2 setzen. Wie groß ist die Wahrscheinlichkeit dafür, daß der 
Wert der Zufallsvariablen X nicht kleiner als 2 ist? 

Wir erhalten 


PXz2)=2 [er = — [e= 22] = ei» 0,0183. 
\ 2 


In komplizierteren Fällen kann man für die Gammaverteilung zur Bereehnung 
der Wahrscheinlichkeit die Tafeln von Pearson [1] heranziehen. 

Die in Beispiel 5.8.1 behandelte Wahrscheinlichkeitsverteilung ist ein Spezial- 
fall der Exponentialverteilung. 

Definition 5.8.2. Wir sagen, daß die Zufallsvariable X eine Exponentialver- 
teilung besitzt, wenn ihre Dichte f(x) durch 


0 für z<<O 
u zu 5.8.11 
fe) ne für 2 >06, ( ) 


wobei A > 0, gegeben wird. 

Wir zeigen noch, daß für Zufallsvariable mit Gammaverteilungen ein Additions- 
satz gilt. 

Es seien X, und X, zwei unabhängige Zufallsvariable mit Gammaverteilungen 
mit den charakteristischen Funktionen 


1 


AM) = a 
a 


Wir betrachten die Veränderliche X = X, + X,. Wegen der Unabhängigkeit . 
der Veränderlichen X, und X, ist die charakteristische Funktion o(f) der Zufalls- 
variablen X gleich 


(k=1,2). 


1 1 1. 


"er 
b u b 


Daraus erkennt man, daß die Zufallsvariable X ebenfalls eine Gammaverteilung 
hat. Damit ist der Additionssatz bewiesen. 

LauA [1] und Luxacs [3] haben Sätze angegeben, die die Gammaverteilung 
charakterisieren. Wir geben hier den nachstehenden, besonders einfachen Satz 
von Luxkacs an! 
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Die Zufallsvariablen X und Y mit nichtausgearteten Verteilungen seien un- 
abhängig und mögen nur positive Werte annehmen. Die notwendige und hinreichende 
Bedingung dafür, daß diese Variablen eine Gammaverteilung mit dem gleichen 
Parameter b haben, ist die Unabhängigkeit der durch die Formeln 


X 
U=X+Y, V=- 
* Y 


definierten Variablen U und V. 


5.9. Die Betaverteilung 


In den Anwendungen (vgl. 9.7) kommt auch eine Verteilung vor, die mit der 
Funktion 


Bing) = [ed - ayrtde (>0,9>0) (5.9.1) 
0 


zusammenhängt. 
Der Leser findet z. B. bei FicutenHorz [1], 8. 784, oder Smirwow [1], S. 223£f., 
den Beweis der Gleichung 


T(p) T(g) 
Tp-+q' 


die die Funktion B(p, q) mit der durch (5.8.1) definierten Funktion I’ verknüpft. 


Definition 5.9.1. Wir sagen, daß die Zufallsvariable X eine Betaverteilung 
besitzt, wenn ihre Dichte f(x) durch 


Bo, = (5.9.2) 


ai a)! für O<e<ml, 0, 0, 
ER ” er 
0) für z<0 und «>21 
(5.9.3) 

gegeben wird. _ 

Daß die Funktion f(x) eine Dichte darstellt, folgt daraus, daß sie nicht negativ 
ist, sowie aus den Formeln (5.9.1) und (5.9.2). 

Es ist angebracht, die Momente der Betaverteilung unmittelbar aus der Formel 


T@+dQ 


m, = —— | art — a) Tide 
Tor 
Ip -+ 4) To+)l(@-+&) 
Pe RER: de 
Tora RN Tarptarm 


n PP +D--(p+k-1) ER 


Pt+))p+g td tgt+k—1 


5.9. Die Betaverteilung 


zu berechnen. Insbesondere ist 


My En 
p+4 
Pr 2(p+1) 
2.7 ’ 
PH)ep+tqa+r) 
a’ A : 


P+r®p+arD 


Abk. 5.9.1 stellt die Dichte der Betaverteilung für 2=q =2 dar. 


Abb. 5.9.1 
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(5.9.6) 


Beispiel 5.9.1. Die Zufallsvariable Y habe eine Betaverteilung mit p = q = 2, die Dichte 


f(y) dieser Verteilung hat also die Form 


0 
IY)=t TU) 
T(@)T(2) 


für ysSOundy=1, 


yi1-y)=6y(1 —y) für 0<y<1. 


Wie groß ist die Wahrscheinlichkeit dafür, daß der Wert der Zufallsvariablen Y nicht größer als 


0,2 ist? 
Wir erhalten 
0,2 


2 


Yo 
vera on =0 [su-nar-s| 3 


0,2 
| = 0,104. 
0 


Zur Berechnung der Währscheinlichkeiten für die Betaverteilung kann man die 


Tafeln von PrARson [4] heranziehen. 


188 5. Einige Wahrscheinlichkeitsverteilungen 


5.10. Die Cauchy- und die Laplaceverteilung 


A. Definition 5.10.1. Die Zufallsvariable X hat eine Oauchyverteilung, wenn 
ihre Dichte von der folgenden Form ist: 


1 4 


are 


>09). (5.10.1) 


Die Funktion f(x) ist nicht negativ. Wenn wir die Substitution 


anwenden, erhalten wir 


[m )d& = - "_y BR [aretan y®, =1. 
iI+f? nr 
Um die charakteristische Funktion der Zufallsvariablen X zu berechnen, 
suchen wir zuerst die charakteristische Funktion der durch die Formel (5:10.2) 
definierten Zufallsvariablen Y, die eine lineare Transformation der Zufalls- 
variablen X darstellt. Die Zufallsvariable Y hat die Dichte 
1 1 


I) = er (5.10.3) 


und die charakteristische Funktion 


[0] 


et Ne n = dy. (5.10.4) 


oo 


Um e(t) zu berechnen, betrachten wir zunächst die Dichte 
1 Seerns 
Kol, er: (5.10.5) 


Die charakteristische Funktion einer Zufallsvariablen mit der Dichte (5.10.5) hat 
die Form 


I I; | 
al) = freta =, [sinn erlvidy 
700 X 


x 
= ii eostye’dy. 
ö 


5.10. Die Cauchy- und die Laplaceverteilung 189 


Wenn wir partiell integrieren, erhalten wir 
f costyeTt’dy = [-e? cos iy]o = Zu sintye’dy=1— ef sin tye’dy. 
0 o 0 


Ebenso ergibt sich 
} \ © © 
[sin tyerrdy = |— eV sinty® + zZ et’ costiydy = i fe» costiydy. 
0 , ö 6 B 
Daraus erhalten wir 
ii et cotydy=1—# il ev costydy 
8 0 


und schließlich 
oo 
1 
9) - [e costydy = Iire (5.10.6) 
0° 
Die charakteristische Funktion (5.10.6) ist im Intervall (— oo, oo) absolut 


integrierbar. Nach der Formel (4.5.6) entspricht ihr. also eine Verteilung mit 
der Dichte 


(5.10.7) 


Unter Beachtung der Formel (5.10.5) erhalten wir 


“ 
eiel— — 
ji + „ 


Wenn wir unter dem Integralzeichen e-:%# durch e! ersetzen (diese Änderung 
hat keinen Einfluß auf den Wert des Integrals) und außerdem die Größen t 
und y miteinander vertauschen, erhalten wir 


oo 
1 [ff ed 


dy. (5.10.8) 


Die rechte Seite dieser Formel ist identisch mit der rechten Seite von (5.10.4), 
und wir erhalten schließlich - 


pl) =erlil. (5.10.9) 


190 3 5. Einige Wahrscheinlichkeitsverteilungen 


Wenn wir beachten, daß X eine lineare Transformation der Zufallsvariablen 
Y ist, erhalten wir die charakteristische Funktion 9,(t) der Zufallsvariablen X 
in der Form 


pp (t) = eu-alti, (5.10.10) 


Wie man leicht bestätigt, ist die Funktion ,(f) im Punkt t = 0 nicht differenzier- 

bar; es existiert also kein endliches Moment der Cauchyverteilung. 
Für die Cauchyverteilung gilt ein Additionssatz. In der Tat, X, und X, seien 

zwei unabhängige Zufallsvariable mit Cauchyverteilungen, deren Dichten durch 


TUE SE RR EI E 
alt (&— m) na t@— m) 


918) = (Au A >0) 
gegeben seien. 
Die entsprechenden charakteristischen Funktionen sind 


a) = eint—Altl ; Pt) = eirst—ralt|, 


Wir betrachten die Zufallsvariable X =X, +X,. Ihre charakteristische 
Funktion wird durch 


pl) = etlutrdt- Qt) tl (5.10.11) 


gegeben. Diese Formel stellt ebenfalls die charakteristische Funktion einer 
Zufallsvariablen mit einer Cauchyverteilung dar. 


B. Beim Beweis der Formel (5.10.9) betrachten wir eine Dichte, die durch die 
Formel (5.10,5) gegeben war. Die ihr entsprechende charakteristische Funktion 
wurde durch die Formel (5.10.6) gegeben. Die Zufallsvariable mit der Dichte 
(5.10.5) ist ein Spezialfall einer Zufallsvariablen mit einer Laplaceverteilung, und 
zwar hat X eine Laplaceverteilung, wenn X =AY + u gilt, wobei Y die Dichte 
(5.10.5) hat. Nach (2.4.10) hat die Dichte von X die Form 


i@) = = exp | ® 1 “) >09. - (5.10.12) 


Die charakteristische Funktion dieser Zufallsvariablen hat die Form 


erti 


1+ 28 


el) = (5.10.13) 


Aus der Formel (5.10.13) folgt, daß eine Zufallsvariable, die eine Laplace- 
verteilung hat, endliche Momente beliebiger Ordnung besitzt. 
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5.11. Die n-dimensionale Normalverteilung 


A. In Beispiel 3.6.1 betrachteten wir einen Spezialfall der zweidimensionalen 
Normalverteilung. Nun wollen wir kurz die allgemeine Form einer mehrdimensio- 
nalen Normalverteilung angeben und untersuchen. 

Definition 5.11.1. Der Zufallsvektor (X, Y) hat eine zweidimensionale 
Normalverteilung, wenn seine Dichte f(x, y) durch 


fe, y) = in (5.11.1) 
270,0, yı — g? 


1 Te-m® „e@-m)y—-m) , Y—m)® 
2 er 21—e) | or 2 60, r o | 


gegeben wird, wobei m,, m,, 01, os und o Konstanten sind, deren Bedeutung wir 
gleich besprechen wollen. 
Man kann zeigen, daß die Gleichung 


oo x h 
f Stwydedy=1 
-©0 —o 
besteht. 
Die Momente der ersten zwei Ordnungen sind 


BEN Br = | — = 
Myam, MM, Mo Mama Mı=eonn. (5.112) 


Die charakteristische Funktion dieser Verteilung hat die Form 


o(t,u) = exp Ki +m,u) — e (MP? + 200,0,8u + ae]. 
(5.11.3) 


Wie wir sehen, hängt die Funktion f(x, y) von fünf Konstanten ab. Über- 
einstimmend mit den Formeln (3.6.5), (3.6.9) und (3.6.26) sind n, und m, die 
Mittelwerte der Randverteilungen der Zufallsvariablen X und Y, die Konstanten 
co, und o, die Standardabweichungen dieser Randverteilungen, während o den 
Korrelationskoeffizienten der Zufalisvariablen X und Y darstellt. 

Wenn 0° = 1 ist, verliert der Ausdruck (5.11.1) seinen Sinn. Nach Satz 3.6.5 
folgt jedoch aus der Gleichung o? = 1, daß mit der Wahrscheinlichkeit Eins 
zwischen den Zufallsvariablen X und Y eine lineare Beziehung Y=aX +5 
besteht. Es liegt dann eigentlich eine eindimensionale Verteilung vor, die singuläre 
zweidimensionale Normalverteilung genannt wird. In Zukunft wollen wir solche 
singulären Verteilungen nicht mehr betrachten. . 
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Ist der Korrelationskoeffizient o gleich Null, so nimmt die Formel (5.11.1) 


die Gestalt. 
— m)? —_ m. 
1 ep I— +[@ ) ar (y—m,) 
270,0, 2 a o2 


fi, Yy) = 


TROIACOEE (5.11.4) 


an; dabei bedeuten f, (x) bzw. f,(y) die Dichten der Zufallsvariablen X bzw. Y. 
Aus der Beziehung (5.11.4) folgt: Sind zwei Zufallsvariable mit einer zwei- 
dimensionalen Normalverteilung unkorreliert (e =), so sind sie unabhängig. 
Wie man weiß, haben nicht alle zweidimensionalen Verteilungen diese Eigen- 
schaft. 
Die bedingte Dichte der Zufallsvariablen Y bei gegebenem X = x hat laut 
Formel (2.7.6) die Gestalt 


nel per Al a BE 
gie) Ze & ie Ver er 202 (1 zz a) [° LM) R 0, (® ") } 
(5.11.5) 


Das ist die Dichte emer N ormalverteilung, deren Mittelwert eine Funktion von 
xist: 


m.(&) = my + 2a (x — m). (5.11.6) 


1 


Die Formel (5.11.6) stellt die Gleichung der Regressionskurve erster Art von Y 
bezüglich X dar. Wie wir sehen, ist hier die Regressionskurve eine Gerade. 

Ebenso erhalten wir für die Regressionskurve von X bezüglich Y die 
Gleichung 


m (y) = mı + nn (y— m). (5.11.7) 
2 A, 


Einen Spezialfall der Regressionsgleichungen (5.11.6) und (5.11.7) betrachteten 
wir schon in Beispiel 3.7.2. 


B. Wir wollen uns jetzt mit der r-dimensionalen Normalverteilung für n 2 2 
beschäftigen. 


Definition 5.11.2. Wir sagen, die Zufallsvariable (X,, X, ..., X,) habe eine 
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n-dimensionale Normalverteilung, wenn ihre Dichtefunktion f(x, Ze ..., &n) 
durch 


Fler &9 > %n) (5.11.8) 


1 1. .* n 
(2a) y|M | n* | „a an 1 | 


gegeben wird; dabei ist |M| +0 die Determinante der Momentenmatrix M, 
deren Elemente A,, durch die Formel (3.6.30) gegeben werden, und |M,,| das 
algebraische Komplement des Elements },, in |M |. 

Wenn die Korrelationskoeffizienten aller Paare von Zufallsvariablen X» 
X ...,Xn gleich O sind, soist !M„.|=0 für j+k, und die X,X,...,X, 
sind voneinander unabhängig. Wir bemerken auch, daß wir es im Fall |7M| =0 
nach Satz 3.6.6 mit einer Zufallsvariablen zutun haben, deren Dimensionszahl mit 
der Wahrscheinlichkeit 1 kleiner als » ist. L 

Die charakteristische Funktion @(t,, tz, ...,t,) einer Zufallsvariablen, deren 
Dichte durch (5.11.8) gegeben wird, hat die Form 


2 
olt,, ba, ...; t.) — eXp ( Am;t; mn \ > Ay L; ) (5.11.9) 
j-1 jk=1 
"Einen Satz zur Charakterisierung der mehrdimensionalen Normalverteilung _ 
hat Lama [2] angegeben. 

Beispiel 5.11.1. Wir bezeichnen mit V die Geschwindigkeit eines Moleküls eines idealen 
Gases. Unseren Untersuchungen legen wir ein rechtwinkliges Koordinatensystem zugrunde. 
Es seien v der Geschwindigkeitsvektor eines Moleküls und V,, V,, V, seine Projektionen auf die 
einzelnen Achsen. Die Lage des Vektors v und seine Länge V sind vom Zufall abhängig; also 
ist (9, V,, V 3) eine dreidimensionale Zufallsvariable. Um ihre Dichte % (v,, v,, v5) zu bestimmen, 
nahm MAXWELL die beiden folgenden Voraussetzungen an: 


h(v1,0905) = Fo) (o) 03)» (*) 
h(v],05,%5) = h(u? + v2 + ©) — h(o3). (#®) 


In der Gleichung (*) bedeuten die Funktionen f(v,), /(v.), f(v3) die Dichten der Zufallsvariablen 
VY,. V,, Y3. Die Voraussetzung (*) besagtalso, daß diese Zufallsvariablen unabhängig sind und 
dieselben Verteilungen haben. Die Voraussetzung (**) besagt, daß die Dichte % (v,,v,,v,) eine 


Funktion der kinetischen Energie des Moleküls ist, die n (+ v2 + v8) beträgt, wobei m 
die Masse des Moleküls bedeutet. Aus diesen Gleichungen ergibt sich 


log hu?) = B> log f(v;), 


i= 


r 


Fe); 
To ” 


3 
Zudu= 2 


h(v?) i=1 i 


13 Fisz 
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Wenn wir die entsprechenden Ausdrücke bei dv; miteinander vergleichen, erhalten wir 
fo _ te _ I) _,_ 
uf)  vefle)  wsflos) 


Die Auflösung dieser Differentialgleichungen ergibt 


const. 


1 
fo) = C exp (5 i) @=1,2,3). 


Da f(v;) eine Dichte ist, muß k <0 sein, wir können also k= — schreiben. Unter 
Berücksichtigung der Formel (*) erhalten wir 2 
en + vo 
h(v,95,05) = 0? Pc ae aa 
(0199,95) exp | 202 


Die Zufallsvariable (7,, V,, V,) hat also eine dreidimensionale Normalverteilung. 
Da k(v,,v,,v3) eine Dichte ist, muß 
1 
(Arco?) 
sein. Die Größe o ist für verschiedene Gase verschieden. 
Zu der in diesem Beispiel behandelten Frage kehren wir im Beispiel 9.4.3 zurück. 


03 


C. Es sei (X, X, ...,X,) eine n-dimensiönale Zufallsvariable mit Normal- 


verteilung. Zur Vereinfachung der Rechnung setzen wir y =0(j=1,2,...,n). 
Wir betrachten die r-dimensionale Zufallsvariable (Y,, ..., Y,), wobei 
Yı=3 0y4SX; l=1,...,r) (5.11.10) 
je 


und r<n ist. Mit u, bezeichnen wir die Kovarianz der Zufallsvariablen Y, 
und Y,(,h=1,..., r). Es ergibt sich j 


n % 
un = EYıY.)=# | ZayX; ou) (8.11.11) 
k=1 


1 
= N 0150 B (X;Xr) = 2 8170 Air. 
1 1 
Wenn wir mit p(%,, ..., %,) die charakteristische Funktion der Zufallsvariablen 
(I .-., Y,) bezeichnen, erhalten wir 


Yo) =E E (#2 0 r)) 
i=1 


I 


n A n 
E E (in ++ iu, 3) 2) 
je1 - je 


I 


B E [ » 3%)| 


j=1 
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mit 
yo tet Wo G=12...,n). 


Berücksichtigen wir (5.11.9), so folgt 


1 n 
va, ..., %r) = eXp (- Ds Pi Any) 


5-1 
i Rn r 
m eXpI — — > Ad, U Un; &nk 
2 je=ı he 
1 r n 
= eXp (- — - U; Un 5 au . 
2 ımı ke 
Daraus und aus (5.11.11) finden wir 
1 T 
Y(ü,, ..., %,) = eXp (- 2 PB ner). (5.11.12) 
Lh=1 


Wenn wir (5.11.12) mit (5.11.9) vergleichen, sehen wir, daß (Y,, ..., Y,) eine r- 
dimensionale Normalverteilung hat. Wir haben also den folgenden wichtigen 
Satz erhalten: 

Satz 5.4111. Es sei (X,,X,,...,X,) eine n-dimensionale Zufallsvariable mit 
Normalverteilung, und Y,,..., Y, (rn) seien lineare Funktionen der Zufalls- 
variablen X; (j =1,2,...,n). Dann ist die Zufallsvariable (Y,,..., Y,) ebenfalls 
normal verteilt. 

Aus diesem Satz folgt insbesondere, daß jede Randverteilung eines normal ver- 
teilten Zufallsvektors normal ist. 


5.12. Die Polynomialverteilung 


. A. Wir wollen das verallgemeinerte Bernoullische Versuchsschema betrachten: 
Ein Versuch werde r-mal wiederholt. Als Resultat eines Versuches kann 
eines der einander paarweise ausschließenden Ereignisse A, G =1,..,r-+1) 
mit der Wahrscheinlichkeit p, = P(A,), wobei + +9, +Pmı =1 ist, 
eintreten. Bei 2» Versuchen kann das Ereignis A, genau k,-mal auftreten 
(k; =0,1,...,n). Wir betrachten die Zufallsvariable (X, ..., X, X,.1). Dabei 
bedeutet X, =k,, daß das Ereignis A, genau k,-mal auftrat. Die Ergebnisse 
der n Versuche sind unabhängig. Wenn wir ähnlich vorgehen wie in Beispiel 3.1.3 
bei der Herleitung der Formel für die Binomialverteilung, so erhalten wir für die 

Wahrscheinlichkeitsfunktion der Zufallsvariablen (X, ..., X, X,+1) die Formel 


n! 


PR =hy.. X, =h, X, = kr) = klerk,lku.n! p 


kı...mlır mlrzı 
Fi Pr Pr ’ 


(5.12.1) 


13* 
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dabei ist 
kı +++ k, + krrı =N. 


Die Formel gibt also die Wahrscheinlichkeit des Produkts an, d.h. die Wahr- 
scheinlichkeit dafür, daß das Ereignis A, genau k,-mal, das Ereignis A, genau 
k,-mal, ..., das Ereignis A,;, genau k,;,-mal auftritt. 

Wir bemerken, daß die Zufallsvariablen X,, X3, ..., X,, X,+1 der linearen Be- 
ziehung 


X, +++, +Xu=n 


genügen. Eine dieser Zufallsvariablen, etwa X,,,, drücken wir durch die anderen 
aus! 


Kun X, - K-e—L. 
. Die Formel (5.12.1) läßt sich nun in der Gestalt 


n! 


— ze ed a 
P(X, =k, dr = k,) = k,!---k,!n _gyıfı 


upergt& (5.12.1') 
mit 

K=ht+ktetk, undg=1—-M—-Mm—-""—P 
schreiben. 


Definition 5.12.1. Wir sagen, eine Zufallsvariable (X,,...,X,) mit der 
Wahrscheinlichkeitsfunktion (5.12.1) habe eine Polynomialverteilung. 


B. Es seien 


(Y®, Y®,..., Y®) und (Y®, Y®,..., 70) 


zwei Zufallsvariable. Die Addition von mehrdimensionalen Zufallsvariablen 
wollen wir vektoriell verstehen, d. h., die Zufallsvariable (X,, X, ..., X,) ist die 
Summe der Zufallsvariablen 


(8, YD,..., Y®) und (Y®,Y®,..., Y®), 
wenn 
X, = YM +Y® G=12,...,r); 
dafür schreiben wir 
Kris) = (v8, yw,..., yo) +(Y®, yo, .., 29). 


Es seien (Y®, Yw,..., Y@®) unabhängige Zufallsvektoren mit derselben 
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Verteilung, die höchstens eine von Null verschiedene Komponente haben, wobei 
fürm =1,2,...,n und für j=1,2%,...,r 


Prm=1)=7, PrP=0)=1-—-p, (5.12.2) 
Pr Sn en Y®) =) =gq —— i — pP, ee IF 


gelten soll. Wie man leicht einsieht, erfüllt eine Zufallsvariable (X,, X, :-:, X,) 
mit einer Polynomialverteilung die Gleichung 


n 
Ki, KEIN, IM, ., 7); 
mi 


Aus (4.6.1) erhalten wir, daß die charakteristische Funktion 9, (ty, fa ..., fr) der 
Zufallsvariablen (Y®, Yim, ..., Yd) für m =1,2,...,n die Form 


T 
UL 2ER PRERERE 7 3 pe" +4 
j=1 
hat. Daraus erhalten wir für die charakteristische Funktion o(f,, ba, ...,,) der 
Zufallsvariablen (X, X, ..., X,) die Formel 


" n r n 
ol, boy 22. 2) — [m (hi; bay aus L) = | Pa + n . (5.12.3) 
m=1 j-1 
Daraus und aus den zu (4.6.8') analogen Formeln folgt für j=1,2,...,r 
E(X)=np, Ay=DMX,) = np;(l — P)) (5.12.4) 


und für), k=1,2,...,r, wenn j=#+kist, 


A = EUR, — np) (Au — npe)] = —NP;Pr. 


5.13. Zusammengesetzte Verteilungen 


A. In den Anwendungen kommen häufig Zufallsvariable vor, deren Verteilung 
von einem gewissen Parameter & abhängt, der seinerseits wieder eine Zufalls- 
variable mit einer. bestimmten Verteilung ist. Wir sagen dann, daß die Zufalls- 
variable X eine zusammengesetzte Verteilung hat. Hier wollen wir uns näher mit 
zwei zusammengesetzten Verteilungen befassen, nämlich mit der zusammen- 
gesetzten Binomialverteilung und der zusammengesetzten Poissonschen Ver- 
teilung. 

Die Zufallsvariablen X, (k—=1,2,...) mögen unabhängig sein und sämtlich 
dieselbe Null-Eins-Verteilung. haben, die durch die Wahrscheinlichkeiten 
PX, =1)=p und P(X,=0)=1-—p gegeben wird. Wir betrachten die 
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Zufallsvariable X = X, + X, +++ Xy,. Für festes N hat X die Binomial- 
verteilung 


PX =s) = () p(1— pN-> (s=0,1,..., N). (5.13.1) 


Es sei nun N eine von X, (k =1,2,....) unabhängige Zufallsvariable, die nach 
dem Poissonschen Gesetz 


yı 
PN=n)=-e" (n =0,1,2,3, ...) (5.13.2) 
RW: 


verteilt ist. Wie wir sehen, spielt hier N die Rolle des erwähnten Parameters «. 
Wir betrachten die zweidimensionale Zufallsvariable (X, N) und erhalten (vgl. 2.7) 


PX=s,N=n=PX=s|N=n)P(N=n). 


Uns interessiert die Wahrscheinlichkeit des Ereignisses X =s, wenn N alle 
möglichen Werte durchläuft. Mit anderen Worten, wir suchen die Randverteilung _ 
der Zufallsvariablen X. Diese Verteilung wird durch die Formel 


Prien ehren er 


gegeben. Bei Berücksichtigung der Formeln (5.13.1) und (5.13.2) erhalten wir, 
da () =0 für n<s ist, 
8 


[ee] yK 
PX=s= a EX pr 
n=0 NY\S 
_e’r 5 rim eipr STAA DIT 
sa (ns)! sta 0 ms)! 
Am 38 ip Ss 
Er = A zum — ® en (5.13.3) 


Das ist eine Poissonsche Verteilung mit dem Mittelwert pA. Diese Verteilung 
nennen wir zusammengesetzte Binomralverteilung. 


Beispiel 5.13.1. Die Wahrscheinlichkeit dafür, daß ein neugeborenes Kind ein Junge ist, 
beträgt 0,517 (vgl. Beispiel 1.1.3). Die Anzahl X der Geburten eines Jungen in einer Familie, 
in der N Kinder (N konstant) geboren wurden, ist eine binomial verteilte Zufallsvariable: 


ns 
PX=9)= | )osım. 0,4835 (s=0,1,...,N). 
s 
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Wir können aber auch nach der Wahrscheinlichkeit der Gleichung X = s fragen, wenn N 
alle möglichen Werte annimmt, also nach der Wahrscheinlichkeit dafür, daß in einer (bezüg- 
lich der Zahl der Geburten) beliebigen Familie s Jungen geboren wurden. Hier ist N eine Zu- 
fallsvariable, deren Verteilung man für die Bevölkerung eines Landes empirisch bestimmen 
kann. Dazu braucht man nur den Anteil der kinderlosen Ehen, der Familien mit emem Kind, 
der Familien mit zwei Kindern usw. zu berechnen. Wenn wir die Verteilung von N kennen, 
können wir, indem wir ebenso wie bei der Herleitung der Formel (5.13.3) vorgehen, die Wahr- 
scheinlichkeit P(X = s) für jedes s berechnen. 


B. Wir wollen uns jetzt mit der zusammengesetzten Poissonschen Verteilung be- 
schäftigen. - 
Die Zufallsvariable X habe eine durch die Formel 
zi 


PX=h= ne" (k = 0,1,2,...) (5.13.4) 


gegebene Poissonsche Verteilung, und A sei eine stetige Zufallsvariable mit der 
Dichte ' 


© 


Aemlemei für A>0, 
fa) = 11'(v) (5.13.5) 
0 für AsS0, 
wobei v>0 und a >0 ist. 


Wir betrachten den Zufallsvektor (X, 1). Hier kommt eine bis jetzt noch nicht 
behandelte zweidimensionale Verteilung vor, in der die eine Zufallsvariable 
diskret und die andere stetig ist. Für jedes A>0 und A,>0 erhalten wir 


PX=k,MSAsAHth) 
=P(X=kIh<SA<SMH+hPASISAHh). 


Wir dividieren beide Seiten dieser Gleichung durch A und gehen für A—0 zur 
Grenze über. Das ist erlaubt, da f({}) >0 für 1>0 ist. Wenn wir die Formeln 
(2.3.8) und (5.13.4) berücksichtigen, erhalten wir 


1 a a? 
im — u <A< — 1 o-thı —__ Z29-1g-ahı 
u PX=k,ı,<siAsAHth) m e 0) Arıereh, (5.13.6) 


Durch den Ausdruck (5.13.6) wird die Verteilung der zweidimensionalen Zufalls- 
variablen (X, A) bestimmt. Die Randverteilung der Zufallsvariablen X erhalten 
wir aus der Formel (wir schreiben wieder A statt A,) 


> k v 
PX =h= en EE Klee d2. 


0 
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Bei Beachtung der Formel (5.8.5) folgt daraus 


oo 


PX = %) z a® Ak+o—1g-(a+1 Pr 
I) k! 
0 
® 1 T(k+v) a "ew+1l)-(+k-1) 
_Tß klfa+i)t \1-+a (1. -+ a)tk! ; 


(5.13.7) 


Zur Vereinfachung der Schreibweise verallgemeinern wir die Bedeutung des 
Symbols & ,‚ das bis jetzt nur für natürliche r einen Sinn hatte. Für jedes x und 
r 


jedes natürliche r definieren wir 


() _ x@ — 1). (@—r+]) _®r 


r r! rt 
ge enge ö 1 a 
Wir führen weiter die Bezeichnungen 2 = 130 q=1-r= 1 ein. Nach 
a 


Voraussetzung ist @ > 0, also gelten die Ungleichungen O<p<1und0<g<i. 
Wenn wir diese Bezeichnungen benutzen, können wir (5.13.7) in der Form 


P(X=k) = (—1)%* (7) pe? :(k=0,12, ...) (5.13.8) 


schreiben. 


Definition 5.13.1. Wir sagen, daß die Zufallsvariable X eine negative Binomial- 
verteilung hat, wenn ihre Wahrscheinlichkeitsfunktion durch die Formel (5.13.8) 
gegeben wird. 

Wir berechnen die charakteristische Funktion dieser Verteilung: 


ei) = YP(X = k) et — HDNERT, =) pteitk, 
2 k=0 


k=0 


Wenn wir für (1 — p)”? die Reihenentwicklung 
oo —y . j 
uns| ‚)® Iel<1, 


benutzen, so erhalten wir 


el =P(l per)”. (5.13.9) 
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Daraus folgt 


a =m, m =vt ( 2 2) (5.13.10) 
q 


Für ein gewöhnliches Moment r-ter Ordnung ergibt sich 


BRETT 
m, = — (r=1,2,..). (8.13.11) 
I=0 = 
GREENWOOoD und YuL£ [2] haben die zusammengesetzte Poissonsche Verteilung, 
die durch die Formel (5.13.8) definiert ist, in einer Reihe von Beispielen angewandt. 
Wir bringen hier eines dieser Beispiele: 


Beispiel 5.13.2. Man hat im Laufe von drei Monaten die Anzahl der Arbeitsunfälle bei 
414 Arbeitern beobachtet. Die Angaben befinden sich in Tabelle 5.13.1. Das Symbol % in der 
ersten Spalte bedeutet die Anzahl der Unfälle, die ein und demselben Arbeiter während der 
Dauer der Beobachtung zustießen. In der zweiten Spalte sind die beobachteten Häufigkeiten 
der Arbeiter, die während der Beobachtungszeit k Unfälle zu verzeichnen hatten, eingetragen, 


Tabelle 5.13.1. 


k beobachtete Wahrschein- 
Häufigkeit lichkeit 
0 0,715 0,722 
1 0,179 0,167 
2 0,063 0,063 
3 0,019 0,027 
4 0,010 0,012 
5 0,010 0,005 
6 . 0,002 k 
7 0,000 . 0,004 
8 0,002 


während sich in der dritten Spalte die entsprechenden Wahrscheinlichkeiten befinden, die nach 
der Formel (5.13.8) berechnet wurden. Die in dieser Formel vorkommenden unbekannten 
Parameter v und p hat man auf folgende Weise gefunden: Man berechnete den Mittelwert 
und die Dispersion der beobachteten Verteilung und nahm an, daß diese gleich #(X) bzw. 
4, sind. Für ZE(X) und a, gelten die Formeln (5.13.10). Auf diese Weise erhielt man zwei 
Gleichungen, aus denen man die unbekannten Parameter bestimmen konnte. 
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Wie wir sehen, unterscheiden sich die beobachteten Häufigkeiten wenig von den berech- 
neten Wahrscheinlichkeiten. Diese Tatsache kann man folgendermaßen erklären: 

Die Wahrscheinlichkeit dafür, daß ein Arbeiter während der Beobachtung % Unfällen unter- 
liegt, wird durch die Poissonsche Verteilung bestimmt, in der der Parameter } vorkommt. 
Auf die Größe dieses Parameters haben verschiedene von der Zeit abhängige Faktoren, wie 
der Stand der Unfallsicherheit, die atmosphärischen Bedingungen und andere, einen Einfluß. 
Man kann also sagen, daß A eine Zufallsvariable ist. Unter der Annahme, daß A eine Gamma- 
verteilung hat, stellte man eine gute Übereinstimmung zwischen der beobachteten und der 
berechneten Verteilung fest. 


€. Definition 5.13.2. Wenn die Zufallsvariable Y eine durch die Formel (5.13.8) 
gegebene Wahrscheinlichkeitsfunktion hat, wo v eine ganze Zahl ist, sagen wir, 
daß sie eine Pascalverteilung besitzt. 

Diese Verteilung kann man auch auf Grund von völlig anderen Überlegungen 
erhalten, und zwar nicht als zusammengesetzte, sondern als einfache Verteilung. 

Wir betrachten eine Folge von Versuchen. Als Ergebnis eines jeden Versuchs 
soll das Ereignis A oder das Ereignis A eintreten können. Die Ergebnisse jeder 
Anzahl von Versuchen sind unabhängig. Wir werden von einem ‚Erfolg‘ sprechen, 
wenn däs Ereignis A eintritt, im entgegengesetzten Fall sprechen wir von einem 
„Mißerfolg“. Essei P(4A)=p, also P(A)=qg=1-—p. 

Wir bezeichnen mit X, die Anzahl der Erfolge, die nach dem (r — 1)-ten 
Mißerfolg eintraten und die dem r-ten Mißerfolg vorausgehen. So ist zum Beispiel 
X, die Anzahl der aufeinanderfolgenden Erfolge vor dem ersten Mißerfolg, X, 
die Anzahl der aufeinanderfolgenden Erfolge zwischen dem ersten und dem 
zweiten Mißerfolg. Wir betrachten die Zufallsvariabe X = X, + X, ++ J,. 

Das Ereignis X =% ist das Produkt zweier Ereignisse: Das eine besteht 
darin, daß der (k + v)-te Versuch ein Mißerfolg ist, und das andere darin, daß 
unter den übrigen k+v— 1 Versuchen k Erfolge zu verzeichnen sind. Die 
Wahrscheinlichkeit des ersten Ereignisses ist gleich q und die des zweiten gleich 


( r = ) 7*g®-!. Daraus erhalten wir 
— (—1)8 n piq? (k=0,1,2,...). (5.13.12) 


Diese Formel ist identisch mit Formel (5.13.8). 


D. Wir beweisen jetzt für die negative Binomialverteilung einen Satz, der das 
Analogon zu Satz 5.5.1 ist, der für die Binomialverteilung galt. 


Satz 5.13.1. Wenn für jedes v die Gleichung 


ER) =» =e 
q 
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besteht, wobei c eine positive Konstante bedeutet, dann konvergiert die Wahrschein- 
lichkeitsfunktion der negativen Binomialverteilung für v — 00 gegen die entsprechende 
Funktion der Poissonverteilung. 


Beweis. Aus Formel (5.13.8) erhalten wir 


vwtlwHh-N 


lim P(X =k) = lim m (1 — p) 
k A BE ® Cab 
_E mr td w+k nf, ce zer: 
PR (v + e)* v-+e kt 
(5.13.13) 


Auf Grund dieser Formel kann man im Fall einer negativen Binomialverteilung 
die Tafeln für die Poissonverteilung benutzen. - 


E. Wir betrachten jetzt eine Zufallsvariable Y, die durch die Formel 
N 
Y=) X, (5.13.14) 
k=1 


gegeben wird; dabei sind X, (k=1,2,...) und N Zufallsvariable, und N nimmt 
nur natürliche Zahlen als Werte an. 


Satz 5.13.2. Die Zufallsvariable N sei von den Veränderlichen X, X, X... 
unabhängig und habe den Mittelwert E(N). Wenn die Ungleichung 


ZP(NZk)E(X,) <o (5.13.15) 


erfüllt ist, existiert der Mittelwert der Zufallsvariablen Y, und es ist 


EIN=SNPINSMER). | (5.13.16) 


k=1 


Beweis. Die Formeln (5.13.14) und (3.6.22) ergeben 


EIN=SPIN =n)E(YIN=n)=NP(N = mE 
n=1 n=1 ‚—1 


= SEX)NPN=n)=NEX)PN>h). 
k=1 n=k k=1 
Wenn wir (5.13.15) berücksichtigen, erhalten wir die Behauptung des obigen 
Satzes. z 

Setzen wir noch zusätzlich voraus, daß die Zufallsvariablen X, dieselbe Ver- 
teilung haben, so ist die Bedingung (5.13.15) erfüllt, wenn der Mittelwert der. 
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Zufallsvariablen X, existiert. Wir wollen ihn mit Z(X) bezeichnen. Die Formel 
(5.13.16) hat dann die Gestalt 


EN =EX)SPNSM=EX)TEPIN=h=E(X)E(N). 
k=1 k=1 


(5.13.17) 


Wie wir sehen, genügt der Mittelwert der zusammengesetzten Binomial- 
verteilung der Gleichung (5.13.17). 


5.14. Aufgaben und Ergänzungen 


1. a) Man zeige, daß die Zufallsvariablen X, und X, unabhängig sind, wenn sie beide die 
Null-Eins-Verteilung aufweisen und nicht korreliert sind. 
b) Man überprüfe, ob alle Zweipunktvariablen diese Eigenschaft aufweisen. 


2. Die Zufallsvariable X möge die Binomialverteilung (5.2.1) haben. Wir setzen 


_PX=k+i) 


= k=0,1,.,”%” —1). 
Ay PX=n ( 0 N ) 


Män beweise die folgenden Behauptungen: 

a) Die Ausdrücke Ay, —1 und (r +1)»P —1—% sind beide entweder gleich Null 
oder beide negativ oder beide positiv. 

b}) P(X=k) nimmt den maximalen Wert entweder in einem Punkt k, an, der der Un- 
gleichung j ö 


rR+1p-1I<kh<(n+ttip 


genügt, wobei (n + 1)» keine ganze Zahl ist, oder aber in den Punkten (nr +1)» — 1 
und (» + 1)p, wenn (n + 1)» eine ganze Zahl ist. 


ec) Für k> (n +1)p gilt die Ungleichung 


Ayk< exp (- een. 


N 


3. Man beweise, daß die Ungleichung 
&, (nı\ fv Re. NR 
206 


Hinweis. Man verwende den Satz über die Addition Zufallsvariabler, die der Binomial- 
verteilung genügen. 


gilt. 


4. Man beweise die Beziehung 
( 


2 fmn\ - n! R hr 
P 0 
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Hinweis. Man integriere partiell und vergleiche die Formeln (10.3.7) und (10.3.8). 
5. a) Man zeige, daß für beliebige A, > 0 und A,> 0 sowie für ganzzahlige nichtnegative 
% die Gleichung 
EM Ar A) 
9 ik — NM! ki 
gilt. 
b) Es seien X, und X, unabhängige Zufallsvariable mit Poissonscher Verteilung mit den 


Parametern 4, und A,. Ferner sei Z=X,— X,. Man bestimme P(Z=k) 
(k=0, +1, 4+2,...) und zeige, daß für den Spezialfall , = 4, = 


P(Z = k) = e-21,(24) 


gilt, wobei /,(2A) die Besselsche Funktion mit rein imaginärem Argument ist. 
6. Die unabhängige Variable Z möge eine verallgemeinerte Binomialverteilung haben. Man 
zeige (in den En von 5.3): Sind die p,. als Funktionen von n so beschaffen, daß 


die Summe zn = konstant ist und daß a, = max (9, Pa +; 9.) für no 


gegen Null ei so gilt 


ar 
lim PZ=r)= ei : (r=0,1,2,...). 
ri 


Nn>X 


(Dieses Ergebnis stammt von von Miszs [5], [6]. Wegen eines stärkeren Ergebnisses siehe 
Hopezs und LeCam [1].) 


7. a) Es sei F (x) die Verteilungsfunktion einer Zufallsvariablen X mit Null- ins Vertellanz: 
Man bestimme die Verteilung der Zufallsvariablen 7 = F(X). 
b) Man löse die gleiche Aufgabe für eine Zufallsvariable X mit Binomialverteilung. 
c) Man löse die gleiche Aufgabe für X mit Poissonscher Verteilung. 


8. Man sagt, die Zufallsvariable X habe eine logarithmische Normalverteilung, wenn ihre 
Dichte die Form 


0 für 2 Sc, 
fe) = ae (log (@ — ce) — m}? für z>ec 
(x — c)o y2r 20° 


hat, wobei c eine gewisse Konstante bedeutet. Man bestimme E(X) und D*(X). 
9. a) Man zeige, daß für jedes > 0 


gilt, wobei ® (x) die Verteilungsfunktion der Normalverteilung N (0;1) ist. 
b) Man ermittle die entsprechende Ungleichung für x < 0. 
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10. 


11. 


12. 


13. 


Die Zufallsvariablen X; = 1,2,3) seien unabhängig und mögen die gleiche Verteilung 
N (0;1) haben. Man bestimme die Verteilungsfunktion der Zufallsvariablen 
Y=max|X,|. 
1si$3 


Die Zufallsvariablen X,, X,, ..., X, seien unabhängig und mögen die gleiche Verteilungs- 
funktion F(x) mit endlichen Momenten beliebig hoher Ordnung haben. Die Größen 
Gy Gy ..., 4, und b,, by, ..., b, mögen den Beziehungen 


genügen, wobei die Folge a}, @,, ..., a, keine Permutation der Folge b,, b,, ..., 5, ist. Man 
zeige, daß die Verteilungsfunktion F(x) dann und nur dann normal ist, wenn die Zufalls- 
variablen L, und L,, 


die gleiche Verteilung haben (MAarcınkıEwicz [1]). 


Man beweise den Satz von CRAMER [4] (siehe 5.7). 

Hinweis. F, (x), F,(&,), 9, (f) und 9, (t) mögen die Verteilungsfunktionen und die charak- 
teristischen Funktionen der Zufallsvariablen X, und X, bezeichnen. ol _ m)[e) sei 
die Normalverteilung der Summe X, + X,. Aus der Ungleichung 


Fu) Pak) <® (Fe) 
erhalten wir für x, < 0 
F,(&,) < A exp (— 27/20? + Bja,|) 
und für 3, >0 
1— Fa) < A’ exp (-x}/20? + B’a,). 
Aus diesen Ungleichungen folgt die Existenz des Integrals (vgl. 6.5) 


oo 
I= [er dr). 
_—o 


Hieraus erhalten wir, daß o,{f) als Funktion des komplexen Arguments.t eine ganze 
Funktion von höchstens zweiter Ordnung ist. Die gleiche Eigenschaft weist @,{f) auf. 
Anschließend verwende man den Satz von HADAMmARD und die Voraussetzung, daß die 
Summe X, + X, normal verteilt ist. 


(Verallgemeinerung des Satzes von CRAMER nach Linnık [1] und Zınger und Lisnik [1].) 
Es seien die p,(t) (= 1,2,...,n) charakteristische Funktionen von nichtausgearteten 
Verteilungen. Man zeige: Gilt die Gleichung 


Io)» = exp (im = n e) 
j=l 


14. 


15. 


16. 


17. 


18. 


19. 


20. 
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für ein gewisses System nichtnegativer Zahlen «,, &, ..., &%, So ist jede Funktion 9;(t} 
charakteristische Funktion einer normal verteilten Zufallsvariablen. 


Es seien X,, X, ..., X, unabhängig, und sie mögen die gleiche Verteilung haben. Man 
zeige, daß dieSumme X, + X,+--- + X, genau dann von der Funktion g(X, X 3 :.., Xn} 
ünabhängig ist, wenn (X, +, X, +0,..,X,-+a) und g(X,X2--..,X,) für 
jedes « die gleiche Verteilung aufweisen (Lana [3]). 


Die Zufallsvariablen X,,X, ..., X, seien unabhängig und mögen die gleiche nicht 
ausgeartete, durch die Verteilungsfunktion F(x) definierte Verteilung haben. Ferner sei 


n n 
U=-X, +-+X V=N Nakıfz 
r=1s=1 
n 2 n 
Bı = N 0, B=N Di Urs 
-1 s=1 s=1 


Man beweise die folgenden Behauptungen: 

a) Ist B, #0 und B, = 0), so ist F(x) dann und nur dann die Verteilungsfunktion einer 
Normalverteilung, wenn die Zufallsvariable V eine konstante Regression (erster Art) 
bezüglich der Zufallsvariablen U hat, d.h., wenn Z(V|u) = E(V) mit der Wahrschein- 
lichkeit 1 gilt. 

b) Ist Z(N=0, BR, +0 und B-+0, soist F(x) dann und nur dann Verteilungsfunktion 
einer Gammaverteilung, wenn die Zufalisvariable V eine konstante Regression be- 
züglich der Variablen U hat (vgl. Luxacos [3]). 


Es seien X,, X,, ..., X, unabhängig, und sie mögen die gleiche Gammaverteilung haben. 
Man zeige (Prrman [1]), daß dieSumme X, + X, ++ X, von einer beliebigen Funk- 
tion g(X], Xg -:-,“X,) unabhängigist, die gegenüber einer Skalentransformation invariant 
ist (d.h. für die g(X,, X --., X.) = glaXy, a8, ...,aX,) fürjedes a>0 gilt). 


Xp X ..., X, seien unabhängig und mögen eine Gammaverteilung mit 5 = 1 aufweisen. 
Man zeige, daß dieSumme X, + X, ++ X, dann und nur dann von der Funktion 
g9(XyXg-..,X,) unabhängig ist, wenn g(X,Xy...,X,) gegenüber einer Skalen- 
transformation invariant ist (LAHA [3]). 

Die Zufallsvariablen X, und X, seien unabhängig und mögen die Verteilung N (0; 1) 
haben. 

a) Man zeige, daß 7” = X,/X, eine Cauchysche Verteilung hat. 

b) Man zeige, daß diese Eigenschaft die Normalverteilung nicht charakterisiert. 


c) Man bestimme die Klasse der Zufallsvariablen, für die die in a) angegebene Bedingung 
erfüllt ist (Lama [6], MauLpon [1] und KoTLarszı [1]). 


Man gebe ein Beispiel für eine zweidimensionale Zufallsvariable (X, Y) an, die keine 
-Normalverteilung hat und deren beide Randverteilungen normal sind. 
(Wegen einer allgemeinen Diskussion der mehrdimensionalen Verteilungsfunktionen mit 
vorgegebenen Randverteilungen siehe FR&cHer [3] und GumBe&r [3].) 


Man gebe ein Beispiel zweier Zufallsvariabler X und Y an, die beide normal verteilt 
sind und deren Summe X + Y keine Normalverteilung besitzt. Man gebe insbesondere 
ein Beispiel dafür, daß die Summe X + Y eine diskrete Verteilung hat. 


208 5. Einige Wahrscheinlichkeitsverteilungen 


21. Die Zufallsvariablen X,, X,, ..., X, seien unabhängig und mögen die gleiche Verteilung 
haben, wobei die Dichte f(x,,% ...,2,) nur eine Funktion der Quadratsumme 
22 +23 -4+..4 2x2 ist. Man zeige, daß dann X,,X,, ..., X, normal verteilt sind. 
Hinweis. Man vergleiche hierzu Beispiel 5.11.1. 


22. a) Man sagt, eine Zufallsvariable X habe eine Paretoverteilung, wenn ihre Dichte /(x) 
durch die Formel 


0 für <a, 
ia) =!a “+ 

8 fürz> x, 

\® 


. gegeben ist, wobei x, und «> 0 gewisse Konstanten sind. Man bestimme den Er- 
wartungswert E(X) und stelle fest, ob dieser stets existiert. Des weiteren bestimme 
man die Mediane der Zufallsvariablen X. 

b) Wir sagen, daß die Zufallsvariable X eine logistische Verteilung hat, wenn ihre Ver- 
teilungsfunktion durch die Formel 


F&)=[1 + e-@e+0]-1 


gegeben ist, wobei « > 0 ist. Man bestimme die charakteristische Funktion und die 
Momente dieser Verteilungsfunktion. Ferner zeige man, daß ihre Dichte f(x) der Glei- 
chung ; 


I) = aF(a)[i — F@)] 


genügt. 
(Wegen der Verallgemeinerung der logistischen Verteilung auf den Fall zweier Dimensionen 
siehe GuMBer [4].) 

23. Im Satz 5.13.2 sei die Voraussetzung der Unabhängigkeit von N und X,, X,, ... durch die 
Voraussetzung ersetzt, daß das Ereignis N =n von den Zufallsvariablen X, fürk>n 
unabhängig ist. Man zeige, daß der Satz auch dann noch gültig bleibt (KoLmoGoROFF 
und PRocHorRow [1]). 


24. Wahrscheinlichkeitsverteilurigen, deren Dichtefunktionen y= f(x) der Differential- 
gleichung 
p xc+a 


ne bu, +bec+ 5? 


genügen, wobei, by, bj, b, Konstanten sind, nennt man Pearsonsche Verteilungen (PEARSON 

[6I-[8]). 

a) Man zeige, daß die Normalverteilung, die Betaverteilung, die Gammaverteilung und 
die Paretoverteilung Pearsonsche Verteilungen sind. 

b) Man zeige, daß die Konstanten a, by, b,, bz sich als Funktionen der Momente erster bis 
vierter Ordnung ausdrücken lassen (falls diese existieren). 


25. Eine Zufallsvariable X heißt unbeschränkt teilbar, wenn sich X für jedes natürliche n 
alsSumme X = X, +8, +-+X, darstellen läßt, wobei die X,.(k=1,2,...,n) un- 
abhängig sind und die gleiche, von n abhängige Verteilungsfunktion F, (x) haben. Die Ver- 
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teilungsfunktion einer unbeschränkt teilbaren Zufallsvariablen heißt unbeschränkt teilbare 
Verteilungsfunktion. 


a) Man definiere die unbeschränkte Teilbarkeit in den Termini der charakteristischen 
Funktionen. 


b) Man zeige, daß normal verteilte Zufallsvariable sowie Zufallsvariable mit Poissonscher, 
Gaußscher und Cauchyscher Verteilung unbeschränkt teilbar sind. 


c) Ist eine Zufallsvariable mit Binomialverteilung unbeschränkt teilbar? 


26. Man zeige, daß die Summe einer beliebigen endlichen Anzahl unbeschränkt teilbarer 
Zufallsvariabler ebenfalls unbeschränkt teilbar ist. 


27. Man zeige, daß die charakteristische Funktion @(f) einer unbeschränkt teilbaren Zufalls- 
variablen an keiner Stelle verschwindet. 


Hinweis. Die unbeschränkte Teilbarkeit zieht für jedes n die Gleichung p(t) = (Pn o)r 
nach sich, wobei p„(f) ebenfalls eine charakteristische Funktion ist. Die Funktionen 
g(t) und ,„(f) sind in einer gewissen Umgebung von t= 0 von Null verschieden, d.h. 
für 1] Sa für eine gewisses a > 0. Anschließend zeige man, daß für jedes e>0 ein 
n derart existiert, daßfür alle # (jt| <a) die Ungleichung 1 — |9,()| < & gilt. Sodann 
greife man auf die in den Aufgaben 4.8.5a und 4.8.7b angegebenen Ergebnisse zurück, 
um zu zeigen, daß sich für jedes a > 0 ein r so finden läßt, daß für alle t, für die |!| <a 
gilt, der Ausdruck 1 — |p,„(f)| beliebig klein ist. Dieses Ergebnis erweitere man auf 
Intervalle |{| < ra bei beliebigem ganzzahligem r. 


28. Es sei p(f) die charakterisiische Funktion einer unbeschränkt teilbaren Verteilungs- 
funktion. Man zeige, daß dann (ra) für jedes c > O eine charakteristische Funktion ist. 
(Eine ausführliche Darstellung der Theorie der unbeschränkt teilbaren Verteilungen 
findet der Leser in dem Buch von L£vy [3] sowie in dem Buch von GNEDENKO und 
Kornocorov [1}.) 
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6. GRENZWERTSÄTZE 


6.1. Einleitende Bemerkungen 


In der bisherigen Darstellung trafen wir schon einige Male auf Grenzwertsätze 
für Folgen von Wahrscheinlichkeitsfunktionen. So war im Satz 5.4.1 die Rede 
von der Konvergenz einer Folge von Wahrscheinlichkeitsfunktionen der Pölya- 
schen Verteilung gegen die entsprechende Funktion die Binomialverteilung und 
in Satz 5.5.1 von der Konvergenz einer Folge von Binomialverteilungen gegen die 
entsprechende Poissönsche Verteilung. Diese Sätze sind Spezialfälle von Grenz- 
wertsätzen, die eine große theoretische und praktische Bedeutung haben. 

Wir unterscheiden lokale und globale Grenzwertsätze. In den lokalen Sätzen 
untersucht man entweder (wie zum Beispiel in den Sätzen 5.4.1 und 5.5.1) den 
Grenzwert einer Folge von Wahrscheinlichkeitsfunktionen diskreter Zufalls- 
variabler oder den Grenzwert einer Folge von Dichtefunktionen stetiger Zufalls- 
variabler. Dagegen untersucht man in den globalen Grenzwertsätzen den Grenz- 
wert einer Folge von Verteilungsfunktionen. In diesem Kapitel werden wir uns 
fast ausschließlich mit Grenzverteilungen von Summen unabhängiger Zufalls- 
variabler befassen. Wir beweisen einige wichtige Sätze über die Konvergenz der 
Verteilungsfunktionen von normierten Summen unabhängiger Zufallsvariabler 
gegen die Normalverteilung. Es sind dies die Sätze von MoIvRE-LAPLAoE (global), 
LINDEBERG-LEVY, LJAPUNOFF und LINDEBERG-FELLER. Außerdem bringen 
wir einen lokalen Grenzwertsatz von GNEDENKO, wonach eine Folge von Wahr- 
scheinlichkeitsfunktionen einer Summe unabhängiger Zufallsvariabler, die nur 
Werte der Form a-+-hk (kh>0, k ganzzahlig) annehmen, gegen die Dichte- 
funktion der Normalverteilung konvergiert. Dieser Satz enthält als Spezialfall 
den lokalen Satz von MoıIvre-LarLice. Außer den Sätzen über die Kon- 
vergenz gegen die Normalverteilung beweisen wir einige Sätze, sogenannte 
„Gesetze der großen Zahlen‘, in denen die Grenzverteilung die Einpunktver- 
teilung ist. 

Die moderne Theorie der Grenzverteilungen von Summen unabhängiger Zufalls- 
variabler hat sich in den letzten 30 Jahren bedeutend entwickelt, hauptsächlich 
auf Grund der Arbeiten von CHINTScHIn [2] bis [5], GNEDENKo [2] bis [4], KoL- 
MOGOROFF [1], [2], [5] und L£vy [1] bis [3]. Es wurde eine einheitliche allgemeine 
Theorie geschaffen, in der die von uns angegebenen Grenzwertsätze Spezialfälle 
- von allgemeineren Sätzen darstellen. Diese Sätze geben Konvergenzbedingungen 
für eine Folge von Verteilungsfunktionen von Summen von Zufallsvariablen, die 
weit allgemeiner als die von uns betrachteten Summen sind, gegen eine Grenz- 
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verteilungsfunktion an und legen auch die Klasse der möglichen, als Grenz- 
verteilungen auftretenden Verteilungsfunktionen fest. 

Eine ins einzelne gehende Behandlung dieser Theorie findet der Leser im 
Buch von L&vy [3] und in der Monographie von GNEDENKo und KoOLMoGoROYV 
[1] sowie Lo&ve [@]. 

Äußerst interessant sind auch die Konvergenzprobleme für Folgen von Ver- 
teilungsfunktionen einer Summe abhängiger Zufallsvariabler. Die ersten Arbeiten 
in dieser Richtung stammen von MArxorr [1] und [3]. Wichtige Ergebnisse auf 
diesem Gebiet erzielte BERNSTEIN [3]. Wir kehren zu dieser Frage noch in 7.5 
zurück. 


6.2. Die stochastische Konvergenz 


A. Wir wollen das folgende Beispiel betrachten: 
Beispiel 6.2.1. Die Zufallsvariable Y„ möge die Werte 


1 2 n—1 
0,—, Ru ‚1 
Rr nr n 


annehmen, und ihre Wahrscheinlichkeitsfunktion sei durch 


r n\1 
?(r.-2)- | E (r=0,1,...,n) (6.2.1) 
Rn r | 2” 
gegeben. 
Wir betrachten die durch 
1 
XL,=-N- z (6.2.2) 


definierte Zufallsvariable X,,. 
Die Zufallsvariable X, kann also die Werte 


1 2 n dan n—4 n—2 1 


2° 2n ” 2n 2n 2n 


Per ’ 


annehmen. Die Wahrscheinlichkeitsfunktion von X,, wird durch die folgende Formel gegeben: 


2r.n n\1 
?(2.- In ‚-()s 


Es sein = 2. Die Zufallsvariable X, kann die Werte 


—05, 0,05 


mit den Wahrscheinlichkeiten 


14* 
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annehmen. Es sei e. eine positive Zahl, etwa & = 0,3; dann ist 
1 1 
P(|X,| > 0,3)=P (x =— 3) + r(x = 3) = 0,5. 


Es sei ferner n=5. Die Zufallsvariable X, kann die Werte 
05, —03, —01, 01, 03, 05 
mit den Wahrscheinlichkeiten 


15 1210 5 1 


2.272 
Annalen: also ist 
P(\X,| > 0,3) = 0,0625. 
Es sei nun n = 10. Die Zufallsvariable X,, kann die Werte 
0,5, —0,4, 0,3, —0,2, —0,1, 0,0, 0,1, 0,2, 0,3, 0,4, 0,5 
mit den Wahrscheinlichkeiten 


1 10 45 120 210 252 210 120 45 10 1 


1024’ 1024’ 1024’ 1024” 1024’ 1024” 1024” 1024’ 1024’ 1024’ 1024 
annehmen; also erhalten wir für 2 = 10 
P(|X.|> 0,3) 0,02. 


Wie wir sehen, ist für n = 10 die Wahrscheinlichkeit dafür, daß der absolute Betrag 
von X, größer als die feste Zahl e = 0,3 ist, sehr klein. 
Aus einem Satz, den wir in 6.3 beweisen werden, folgt, daß für unser: Beispiel 
lim P(}X,„| > 0,3) = 0 (6.2.3) 
RX . 


ist; dabei wird sich zeigen, daß für die Folge der Zufallsvariablen X,, die durch die Formel 
(6.2.2) definiert sind, die Beziehung (6.2.3) für jedes e>0 gilt. 


B. Ehe wir zu diesem Satz übergehen, wollen wir den Begriff der stochastischen 
. Konvergenz definieren. 


Definition 6.2.1. Die Folge der Zufallsvariablen X, konvergiert stochastischt) 
gegen Null, wenn für beliebige e > 0 die Beziehung 
im P(X,|>e)=0 (6.2.4) 


no 
erfüllt ist. 


!) In der 'iheorie der reellen Funktion entspricht der stochastischen Konvergenz die 
„Konvergenz dem Maße nach“. 

An Stelle von „stochastischer Konvergenz“ trifft man in der Literatur auch häufig die 
Bezeichnung „Konvergenz in (der) Wahrscheinlichkeit‘ an. 
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Wir weisen darauf hin, daß in dieser Definition keine Rede davon ist, daß die 
Zufallsvariable X, im Sinne der klassischen Analysis gegen Null konvergiert. 
Wenn also die Folge der Zufallsvariablen X, stochastisch gegen Null konvergiert, 
so folgt darausnoch nicht, daß man für jedes e ein endliches n = n, finden kann 
derart, daß für alle n > n, die Beziehung !X,| se erfülltist. Aus der Definition 
der stochastischen Konvergenz folgt nur, daß die Wahrscheinlichkeit des Er- 
eignisses |X„| >e für n —oo gegen Null strebt. 


Satz 6.2.1. Es sei F,(«) mn =1,2,...) die Verteilungsfunktion einer Zufalls- 
variablen X,. Die Folge {X,} konvergiert dann und nur dann stochastisch gegen 
Null, wenn die Folge {F„(x)} der. Beziehung 


lim F 0 für x <9, nr 
we oz 1 für z<>0O ea 
genügt. 
Beweis. Die Folge (X„} möge stochastisch gegen Null konvergieren. 
Aus (6.2.4) folgt, daß für ein beliebiges e für n > oo 
PXRn<-)=P(-2)—0, (6.2.6) 


PX, >)=1-P(X,<se)=1—-F,(e)- PX, =E)>0 (6.2.6) 

gilt. 
Da wir zujedem & > 0 stets ein e, so finden können, daß 0 <., < e ist, folgt 
aus (6.2.4), daß P(X, = e) —0 fürjedes e > 0 gilt. Aus (6.2.6) erhalten wirsomit 


1- Fl) >0. (6.2.7) 


Wir ersetzen e durch —x in (6.2.6) und durch & in (6.2.7), wobei x >60 ist, 
und finden (6.2.5). 
Nun sei (6.2.5) erfüllt. Für ein beliebiges e > 0 erhalten wir dann 


lim P(X„< -e) = lim F,(—e) =, 


NR. non 


im P(X,„>e)<slimP(X,=2e= ki n(l F„(e)) =(0 


n>X NRX 


Aus diesen beiden ar folgt sofort (6.2.4), womit der Satz vollständig 
bewiesen ist. 

Wie wir uns erinnern, hat eine Zufallsvariable X, die eine Einpunktverteilung 
mit P(X =0) = 1 besitzt, eine durch die Formel 


0 für z=sS0, 


1 für 2&> 0 wze) 


Fe =| 
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definierte Verteilungsfunktion. Diese Verteilungsfunktion ist in jedem Punkt 
x => 0 stetig. Aus den Beziehungen (6.2.5) und (6.2.7) folgt, daß die Folge der 
Verteilungsfunktionen F,(x) in jedem Punkt x == 0 gegen die durch die Formel 
(6.2.8) definierte Verteilungsfunktion F(x) (im gewöhnlichen Sinne) konvergiert. 
Abschließend können wir.also zusammenfassen: Die Folge der Verteilungs- 
funktionen F',(x) einer stochastisch gegen Null konvergierenden Folge von 
Zufallsvariablen strebt in jedem Punkt x = 0 gegen die Verteilungsfunktion einer 
Zufallsvariablen mit einer Einpunktverteilung. 

Da die Punkte 2 +0 Stetigkeitsstellen dieser Verteilungsfunktionen sind, 
können wir das erhaltene Ergebnis auch so formulieren: 


Eine Folge {X} von Zufallsvariablen konvergiert dann und nur dann stochastisch 
gegen Null, wenn die Folge der Verteilungsfunktionen dieser Zufallsvariablen gegen 
die durch (6.2.8) definierte Verteilungsfunktion F(x) in jeder Stetigkeitssielle der 
Funktion (im üblichen Sinne) konvergiert. 


Wir betonen nochmals, daß in einer Unstetigkeitsstelle der Verteilungsfunktion 
F(«), d.h. im Punkt x =0, die Folge {F„(0)} nicht gegen F(0) zu konvergieren . 
braucht. 

Man kann auch die stochastische Konvergenz einer Folge von Zufallsvariablen 
X, gegen eine feste Konstante c +0 definieren: Wir verstehen darunter die 
stochastische Konvergenz der Folge {Y,} = {X, — c} gegen Null. 

Ähnlich kann man die stochastische Konvergenz einer Folge {X,} von Zufalls- 
variablen gegen eine Zufallsvariable X erklären. Darunter verstehen wir, daß die 
Folge {Z,} = {X„ — X} stochastisch gegen Null konvergiert. 


6.3. Das Bernoullische Gesetz der großen Zahlen 


Wir wollen jetzt den schon in 6.2 angekündigten Satz beweisen. Einen Spezialfall 
dieses Satzes stellt die Formel (6.2.3) dar. Wir bezeichnen mit {Y,} eine Folge 
von diskreten Zufallsvariablen, deren Wahrscheinlichkeitsfunktionen durch 


Pr. = .) = (n) Pi—pT. (6.3.1) 
a Rn 


r 


definiert sind; dabei it O<p<1, und r kann die Werte 0,1,2,...,n an- 
nehmen. Wir führen weiter folgende Bezeichnung ein: 


Seren (6.3.2) 


Satz 6.3.1. Die durch die Bedingungen (6.3.1) und (6.3.2) bestimmte Folge von 
Zufallsvariablen X, konvergiert stochastisch gegen Null, d. h., für jedes e>0O ist 


lim P(IX,|>2)=0. (6.3.3) 


Nn>00 
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Beweis. Zum Beweis benutzen wir die SELTEDSEONERENDE Ungleichung. 
Auf Grund der Gleichungen (5.2.8) ist 
E(X,)=0, (6.3.4) 
- DK) = . (6.3.5) 
n 


Wenn wir in die Tschebyscheffsche Ungleichung die Ausdrücke (6.3.4) und 
(6.3.5) einsetzen, erhalten rir 


e(1x.1>%] Zee) 2 (6.3.6) 
N k2 
wobei % eine beliebige positive Zahl ist. Wir nehmen 
es Y en 
pii—p) 
und setzen -liesen Wert in die Ungleichung (6.3.6) ein. Es ergibt sich dann 
Pix,i>9stl-d 1 (6.3.7) 
ne? ne? 


Aus (6.3.7) folgt, daß für ein beliebiges festes e> 0 die Beziehung: (6.3.3) gilt, 
was zu beweisen war. 

Den soeben bewiesenen Satz nennt man das Bernoullische Gesetz der großen 
Zahlen. 

Dieses Gesetz der großen Zahlen kann man folgendermaßen deuten: 

Wir führen rn Versuche nach dem Bernoullischen Versuchsschema aus; dabei 
ist die Wahrscheinlichkeit, daß das Ereignis A eintrifft, gleich ». Das Gesetz der 
großen Zahlen besagt nun: Ist n genügend groß, dann ist die Wahrscheinlichkeit 
dafür, daß die Häufigkeit des Ereignisses A sich wenig von p unterscheidet, 
nahezu Eins. 

In den nächsten Paragraphen werden wir andere Gesetze der großen Zahlen 
kennenlernen. 


6.4. Die Konvergenz einer Folge von Verteilungsfunktionen 


In 6.2 haben wir gezeigt: Konvergiert die Folge von Zufallsvariablen X, 
stochastisch gegen Null, so strebt die Folge {F„(x)} der Verteilungsfunktionen 
dieser Zufallsvariablen gegen die Verteilungsfunktion (6.2.8) der Einpunktvertei- 
lung, und zwar in jeder Stetigkeitsstelle dieser Verteilungsfunktion. 
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Wir wollen uns jetzt allgemein mit Fragen der Konvergenz einer Folge von 
Verteilungsfunktionen befassen. 


Definition 6.4.1. Die Folge der Verteilungsfunktionen F,,(x) einer Folge von 
Zufallsvariablen X, heißt konvergent, wenn eine Verteilungsfunktion F(x) 
existiert, so daß für jede Stetigkeitsstelle von F (x) die folgende Beziehung erfüllt 
ist: Ba 

lim F„(x) = F(x). (6.4.1) 


N->0O 


Die Verteilungsfunktion F(x) nennen wir Grenzverteilungsfunktion. 

Wie dieser Definition zu entnehmen ist, verlangt man nicht, daß die Folge der 
Verteilungsfunktionen auch in den Unstetigkeitspunkten von F(x) gegen F(x) 
konvergiert. : 


Wir kehren nochmals zum Beispiel 6.2.1 zurück. Auf Grund von Satz 6.3.1 konvergiert 
die durch die Formel (6.2.2) definierte Folge von Zufallsvariablen X, stochastisch gegen Null. 
Also konvergiert die Folge der Verteilungsfunktionen F„(z) dieser Zufallsvarisblen gegen die 
durch die Formel (6.2.8) definierte Verteilungsfunktion F(x). Diese Verteilungsfunktion ist 
im Punkt « = 0 unstetig. Wir überzeugen unsleicht, daß die Zahlenfolge {F'„(0}} nicht gegen 
F(0) konvergiert. 

Wir betrachten die Teilfolge der Folge {F,(0)}, die nur aus Gliedern mit ungeradem Index 
n=2k-+1 besteht. Die Zufallsvariable X,,,, kann die Werte 


’ EEE) 3 


1 2-@k+1) 4—- (2k-+1) 2k+1—-4 241-3 A 
2° 2(2k +1) 2(2k --1) 2(@2k +1) 2@Q@kE+1) 2 


annehmen. Für jedes & ist die eine Hälfte dieser Werte kleiner und die andere größer als 
Null. Die Wahrscheinlichkeit, daß X,,., einen kleineren Wert als Null annimmt, beträgt 0,5. 
Damit ist für jedes k 


P&gsı <0) = Far (0) = 05, 
also, da F(0)=0 ist, 
lim Pa. (0) = 0,5 & F(0). (6.4.2) 


E00 


Daher kann die Folge {F„(0)} nicht gegen F(0) = 0 konvergieren. Es ist also 
lim F„(0) # F(0), 


Nno>X 


obwohl nach der Definition 6.4.1 die Folge der Verteilungsfunktionen des Beispiels 6.2.1 
gegen die durch die Formel (6.2.8) definierte Verteilungsfunktion konvergiert. 


Wir bemerken ausdrücklich, daß wir nur dann sagen, eine Folge von Ver- 


‚teilungsfunktionen konvergiere, wenn 'sie gegen eine Verteilungsfunktion kon- 


vergiert. Dieser Vorbehalt ist wesentlich, da es vorkommen kann, daß eine Folge 
von Verteilungsfunktionen gegen eine Funktion konvergiert, die keine Ver- 
teilungsfunktion ist. 
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Beispiel 6.4.1. Wir betrachten die Folge der Zufallsvariabler. X, die eine durch 
PX, =n=1 (n=1,2,3,...) 


gegebene Einpunktverteilung haben. Die Verteilungsfunktion F'„(x) der Zufallsvariablen X, 
hat die Form 


7%) 0 für zZ, 
2) = 
5 1 für z>n. 


Hier besteht die Beziehung 


lim F„(&) = 0 (-o<2<o). 
n>X a 


Die Folge {F„(x)} konvergiert also nicht gegen eine Verteilungsfunktion. 


Die Folge von Verteilungsfunktionen F, (x) konvergiere gegen die Verteilungs- 
funktion F (x), a und 5b (a < b) seien zwei beliebige Stetigkeitspunkte der Grenz- 
verteilungsfunktion F(x). Dann besteht die Beziehung 


lim Pa <X,<b) = F{b) —- Fa). (8.4.3) 


Nn->09 


In der Tat, es ist 
Paz=X,<b = f,(b) — F,(a). (8.4.4) 


Aus der Voraussetzung, daß « und 5 Stetigkeitsstellen der Verteilungsfunktion 
F (x) sind, folgen die Beziehungen 


F,() > F(b), F.(@) = F (a). (6.4.5) 


Aus den Formeln (6.4.4) und (8.4.5) folgt (6.4.3). 

Die Folge der Verteilungsfunktionen F,(x) konvergiere gegen die Verteilungs- 
funktion F(x); P,($) und P($) seien die entsprechenden Wahrscheinlichkeits- 
funktionen. Man kann zeigen, daß die Beziehung 


lim P,(8) = P(8) (6.4.6) 
für jede Borelsche Menge $ besteht, für die P(5 N RR) =0 ist, wobei A hier 
die Menge der Berührungspunkte von A bedeutet und R die x-Achse ist. 

Wir weisen darauf hin, daß sogar in dem Fall, daß die Grenzverteilungsfunktion 
überall stetig ist, Borelsche Mengen S existieren können, für die die Beziehung 
(6.4.6) nicht gilt. Dies ist stets der Fall, wenn ? (5 nK- 8) >0 ist. Das fol- 
gende interessante Beispiel verdanken wir Rossuss [2]. 
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Beispiel 6.4.2. Die Zufallsvariable X, (n=1,2,...) möge die durch 


2n R i € { 
— fü —-—<e<—, 

In&) = € n nn. Dr n 
0 im übrigen Gebiet 


definierte Dichte f,(x) haben, wobei =1,2,...,n und 0<e< 1 ist. Die Verteilungsfunk- 
tion F„(x) der Zufallsvariablen X, hat somit die Form 


1 für <<s0O, 
i—1 v—1 i € 
für Ssıs a -— : 
n n n n.2* 
F,@) = an (6.4.7) 
v—1 Zn n n.2r i 
+ 2” für <ie<— 
Rn € n n. 28 Rn 
1 : für. «>1. 
Für jedes x aus dem Intervall /=[0,1] haben wir also 
1 
0<r-F,&@)S—. (6.4.8) 
5 


Berücksichtigen wir darüber hinaus die Werte, die F'„ (x) außerhalb des Intervalls / annimmt, 
so erhalten wir für jedes reelle x die Beziehung 
0 für zS0, 
imPr,@)=Fa)=!x fü 0<x<1, (6.4.9) 


1 für &>1. 


Nun bezeichnen wir mit 8, die Menge, in der f„(x)> 0 ist, und mit S, die durch 


So=Y 5, 
n=] 


definierte Borelsche Menge. P„(S) und P($) mögen die Wahrscheinlichkeitsfunktionen be- 
zeichnen, die den Verteilungsfunktionen F,„(x) und F({x) entsprechen. Für n=1,2,... gilt 
dann 


Be [hd -1. 
Sn 


Wegen 5%. > S, erhalten wir P,(S%) = 1 und damit 
lim P, (8%) =1. 


NO 


Andererseits haben wir 


P(8%) = [d.< [» - ) =e<i1 (6.4.10) 
Soc n=1 


n. 2 
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und somit 
lim P, (So) # P(&%); 
no ; 


obwohl die Grenzverteilungsfunktion F (x), die durch (6.4.9) definiert wurde, überall stetig 
ist. Dies ist der Fall, weil 


P(S% n R— 8%) >0 

gilt. In der Tat!), wir haben 
P(S% n R- 8.) = P(S% nI— 8%). 

Ferner ist die Menge I — $., abgeschlossen und nirgends dicht in / und damit 
I-84=1-8, swe I-1-8)=8.=1. 


Hieraus erhalten wir unter Berücksichtigung von (6.4.10) 
P(SgnT-8%)=PUInI-8%)=PI-8)Z21-e. 


B. Wir geben jetzt eine Verallgemeinerung der Definition 6.4.1-für den Fall von 
Zufallsvektoren. 


Definition 6.4.2. Die Folge der Verteilungsfunktionen {F, (x, &3...., %)} 
der Zufallsvektoren {Xy1, Xa2 -.-, Xnx} heißt konvergent, wenn eine Verteilungs- 
funktion F(@,,%3 ...,%,) derart existiert, daß an jeder Stetigkeitsstelle die Be- 
dingung 


lim F,(&1, & +..,%) = F (X 22 -.- , %) (6.4.11) 
erfüllt ist. 

Ist (6.4.11) erfüllt und bezeichnen P,„($) und P(8) die entsprechenden Wahr- 
scheinlichkeitsfunktionen, so läßt sich leicht zeigen, daß für eine beliebige 
Borelsche Menge S in einem k-dimensionalen euklidischen Raum R*, für die 

P(SnR— 8) = = gilt, die Beziehung (6.4.6) erfüllt ist. Diese Beziehung gilt ins- 
besondere für Stetigkeitsintervalle (vgl. 2.5.C). 


C. Von großer Bedeutung für Anwendungen ist der nachstehende Satz (SVERDRUP 
[1], PRocHorow [3]), den wir ohne Beweis angeben: 


Satz 6.4.1. Es sei {F, (X %95 - -- > 9); (n=1,2,...) eine Folge von Verteilungs- 
funktionen der Zufallsvariablen (Kar Ana + Anr), und es seien F(x,, %, .--, %) 
bzw. P(S) die Verteilungsfunktion bzw. die Wahrscheinlichkeitsfunktion der 
Zujallsvariablen (X, X, ..., Ar). Die Beziehung (6.4.11) gilt dann und nur dann, 
wenn für eine beliebige Funktion g(&,,%2, ...,%;), die auf einer der Gleichung 


!) Informationen über die hier benutzten Begriffe finden wir z. B. bei. HAvsporrr [2]. 
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P(8)=1 genügenden Menge 8 stetig ist, die Beziehung 
lim Z,(&) = H (a), 


NR 
wobei H„(&) bzw. H(«) die Verteilungsfunktionen von g (Kar, Anz --- > Xu) bzw. 
9(X,, X -.., Xr) sind, in jeder Stetigkeitsstelle der Funktion H («) erfüllt ist. 


6.5. Das Stieltjessche Integral 


In den weiteren Betrachtungen werden wir einen Satz benutzen, der von L&vy [3] 
und CRAMER [1] bewiesen wurde und uns erlaubt, die Untersuchung des Konver- 
genzverhaltens der Folge {F,„(x)} von Verteilungsfunktionen der Zufallsvariablen 
{X,} an ihren charakteristischen Funktionen »,(t) durchzuführen. Dieser Satz 
hat große Bedeutung in der Wahrscheinlichkeitsrechnung. 

‚ Der Beweis des Satzes verlangt die Einführung des Begriffes des Stieltjesschen 
Integrals. Dabei wird sich auch zeigen, daß wir die bis jetzt gesondert behandelten 
diskreten und stetigen Verteilungen mit Hilfe des Stieitjesschen Integrals gemein- 
sam erfassen können. \ 

Zunächst führen wir den Begriff einer Funktion von endlicher Variation ein. 
F (x) sei eine im Intervall [a, b] (dieses Intervall kann auch unendlich sein) defi- 
nierte Funktion. Wir zerlegen das Intervall durch die Punkte 


eng <—u <m<<m—=b 


in Teilintervalle und bilden die Summe 


n—1 
T > [IF (1) — Fian)|. 


Der Wert 7 hängt natürlich von der Zahl » und der Zerlegung des Intervalls 
[e, 5] in Teilintervalle ab. 


Definition 6.5.1. Die obere Grenze der Menge aller möglichen Werte von 7 


nennen wir die totale Variation der Funktion F (x) im Iniervall [a, b). 


Definition 6.5.2. Wenn die totale Variation der Funktion F(x) im Intervall 
[@, b] endlich ist, sagen wir, die Funktion F(x) sei im Intervall [e, 5] von endlicher 
Variation. 


Jede beschränkte und niechtabnehmende Funktion F(x) ist von endlicher Va- 
riation. Der Ausdruck F(&,,1) — F(&,) ist dann natürlich für beliebiges k und eine 
beliebige Zerlegung des Intervalls [«, 5] nichtnegativ. Es besteht also die Beziehung 


TS TR lu) — Fi] = Fb) — Pla), 


k=0 


wobei nach Voraussetzung F(b) und F(a) endlich sind. 
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Daraus folgt, daß jede Verteilungsfunktion von endlicher Variation ist; die 
totale Variation der Verteilungsfunktion F (x) beträgt nämlich 


Fi) — F(-o) =1. 


Wir wollen jetzt den Begriff des Stieltjesschen Integrals erklären. In einem 
endlichen Intervall [a, 5] seien die Funktionen g(x) und F(x) gegeben. Dabei 
setzen wir voraus, daß die Funktion F'(x) von endlicher Variation und linksseitig 
stetig ist und keinen Sprung im Punkt 5 hat und daß ferner die Funktion 9 (x) 
stetig ist. 

Wir zerlegen das Intervall [a, 5] durch die Punkte 


a=y <<< =b 


in » Teilintervalle. Im %-ten Teilintervall [x,, x.) wählen wir. einen beliebigen 
Punkt x; und bilden die Summe 


n—1 
= zZ a) Fer) — Flan)]- (6.5.1) 


Definition 6.5.3. Wenn die Summe 8 für n — oo und max (2.41 — 2) >0 
gegen einen bestimmten Grenzwert / strebt, und zwar unabhängig von der 
Wahl der Punkte x;. und der Zerlegung des Intervalls [e, 5], dann nennen wir 
diesen Grenzwert das Stieltjessche Integral der Funktion g(x) nach der Funktion 
F («). Dieses Integral schreiben wir in der Form 


vb. 
I=lim 8 — [g@)dF(e). (6.5.2) 
u) & i 

Wie wir sehen, ist das Stieltjessche Integral eine Verallgemeinerung des Rie- 
mannschen Integrals: Für F(x) =x stellt die Formel (6.5.2) ein Riemannsches 
Integral dar. j 

Im Fall eines unbegrenzten Integrationsintervalls definiert man das uneigent- 
liche Stieltjessche Integral als Grenzwert einer Folge von eigentlichen Stieltjes- 
schen Integralen. Wenn also der Grenzwert 


b 
lim [gle)dF(«) 
a>—-© a . 
b->00 

existiert, wobei « und 5 auf beliebige Weise gegen — oo bzw. oo streben, dann 
nennen wir diesen Grenzwert das uneigentliche Stieltjessche Integral der Funktion 
g(x) nach der Funktion F (x). 

Wir führen ohne Beweis einige Eigenschaften des Stieltjesschen Integrals an: 

1. Wenn c und ! Konstante sind, dann ist 


b b 
IKZIOLI2 20) = et [g@)dFl). 


222 6. Grenzwertsätze 


2. Existieren die Integrale auf der rechten Seite der beiden nachstehenden 
Gleichungen, so existieren auch die Integrale auf der linken Seite, und es ist 


Fi (2) + ge] AR (« - [ai (“)dF(« + [ate)are *), 


f 9(@) ALF,(®) + Fal)] = f g@) AR) + f 9@)AF,(). 
3. Wenn a <c<b und die drei Integrale 


v 
fs g(z)dF (x), Jowareı, Joe 


%& 


sämtlich existieren, dann gilt die Gleichung 
d 
fs (x)dF(x = for (2) dP( 0 + [oc x)dF(x). 
[22 


Die Eigenschaften 2 sind für Summen von beliebig vielen Funktionen g;(x) 
und F;(x) erfüllt, und Eigenschaft 3 gilt für beliebig, aber ach viele Punkte 
a<y <<. <n<b. 

Ist die Funktion g(x) stetig und beschränkt auf der ganzen x-Achse, dann 
existiert sowohl jedes eigentliche als auch das uneigentliche Stieltjessche Inte- 
gral. Das Stieltjessche Integral kann aber auch für unbeschränkte Funktionen 

9(x) existieren. 

Die Funktion F (x) habe im Intervall [a, 5] die Ableitung F’ (x), und es existiere 
das Riemannsche Integral der Funktion F’ (x). & 

Wenden wir die Formel von LAgrAngE (Mittelwertsatz) an, so erhalten wir 


b n—1 b 
[s@dre) =im Zora - m) = [s@F' @) de. 
@ n>X K=0 & 


Unter diesen Bedingungen wird das Stieltjessche Integral auf das Riemannsche 
Integral der Funktion g(z)F’(x) zurückgeführt. Insbesondere ist, wenn F(x) 
die Verteilungsfunktion einer stetigen Zufallsvariablen X mit der Dichte f(x) ist, 


fn (x) dF(x) = [ot fi) de. | (6.5.3) 


Es sei nun Fa) die Verteilungsfunktion einer diskreten Zufallsvariablen mit 
den Sprungstellen x], 2;, x, ... Die Verteilungsfunktion F(x) ist dann durch die 
Formel 


=3 Far+0) - Fe] 


,<E 
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gegeben. Wenn wir nun die Formeln (6.5.1) und (6.5.2) berücksichtigen, erhalten 
wirfür x, € [e, b) 


b 
sa dre) = I otenpe. (6.5.4) 


Aus (6.5.3) und (6.5.4) folgt: Existiert der Mittelwert der Zufallsvariablen 
Y=g(X), dann wird er sowohl für eine stetige Zufallsvariable X als auch für eine 
diskrete Zufallsvariable durch die Formel 


x 


Big(X)] = [g@)dF(«) (6.5.5) 


-o© 


.gegeben. Hierbei ist F(x) die Verteilungsfunktion der Zufallsvariablen X. 

Die bisher nebeneinander gebrauchten Formeln, die Integralformeln für 
stetige Zufallsvariable und die Reihenformeln für diskrete Zufallsvariable, kann 
man nun bei Benutzung des Stieltjesschen Integrals einheitlich in Gestalt einer 
einzigen Formel schreiben. So erhalten wir z. B., wenn wir in der Formel (6.5.5) 
g(x) = x” setzen, für ein Moment r-ter Ordnung den allgemeinen Ausdruck (vgl. 
den Anhang) 


Mm, = E(X’) = [ardFe). 


— 00 


Ebenso erhalten wir, wenn wir g(z) = ei* setzen, für die charakteristische 
Funktion 


Pi) = [ew dr. 


Existiert das Stieltjessche Integral (6.5.2) und ist die Funktion g(x) an den 
Stellen «a und 5 stetig, so läßt es sich nach der Formel 


b db 
[oo dr @) = a) F@)k — [ Fle) dgl) 


durch partielle Integration berechnen. 

Es lassen sich auch leicht die nachstehenden Formeln für die Verteilungsfunk- 
tionen einer Summe, einer Differenz, eines Produkts und eines Quotienten un- 
abhängiger Zufallsvariabler X und Y ohne die Voraussetzung herleiten, daß der 
Zufallsvektor (X, Y') stetig ist. (Die Beweise dieser Formeln findet der Leser im An- 
hang.) 
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Es seien F, (x), F,(y) und F (2) die Verteilungsfunktionen der Zufallsvariablen 


X, Y und Z. Dann gelten die folgenden Beziehungen: 
L.ItZ=X-T,sogit 


Fe) = [P,@— )dF,l) = [Fe Ydr,). 


I.It z=X—-Y, so gilt 
. oo 
F@a=[Fe@+y)dr,g). 


—00 


ELIst Z=XY mit PX =0)=P(Y=0)=0, sogüt 


F«@) = [Il — Falle] ER) + [ Flle) EP, («) 
E ; 


= [11 - F@yldr,(y) + | Fıely) AR). 
= r 


IV. ist Z= ei mit P(7T=0)=0, sogilt 


X 


Fe) = [I Fı@y)ldr,ty) + [Fı@y) dry). 


0 


6.6. Der Satz von Levy und Cramer 


(6.5.6) 


(6.5.7) 


(6.5.8) 


(6.5.9) 


Den obenerwähnten Satz von L£vy und CÜRAM&R stellen wir zuerst in Form von 


zwei Sätzen dar. 


Satz 6.6.1a. Komvergiert die Folge {F,„(x)} (in =1,2,3,...) von Verteilungs- 
funktionen gegen die Verteilungsfunktion F(x), so konvergiert die entsprechende 
Folge {p„(t)} der charakteristischen Funktionen an jeder Stelle t (—-co< ii <.oo) 
gegen die Funktion o(f), wobei »{l} die charakteristische Funktion der Grenz- 
verteilungsfunktion F(x) ist; die Konvergenz ist dabei gleichmäßig in t in jedem 


endlichen Werieintervall von t. 


Beweis. Nach Definition der charakteristischen Funktion ist 


x [0] 


9) = f etz dF,(&), = f etz UF (x). 


0 — 00 
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Sind a<0 und 5>0 zwei NR der Verteilungatunktion F(«), 
so Daun wir 


& b 2 
= few ar.@)+ [edr,@) + [erde = In + Im + Ins 
rn @ b 


ıl)= few are) + ferarı 3+ fear) - L+1,-+J1;. (6.6.1) 


X 


Wir integrieren die Differenz 
b 5 
Ina I, = [et dr.) — [e®dF(e) 
a a 


partiell und erhalten 
b 
Ina — I = ei [Fo — [F@I) — it [LFRE) — Fla)let de, 
& 
also 


In — Bis Fb) F)|+ Pd) —-Fla)l Hi IF.) —F(a)ide. 


Es sei &> 0 beliebig gewählt. Aus den Voraussetzungen des Satzes und daraus, 
daß a und 5 Stetigkeitsstellen der Verteilungsfunktion F(x) sind, folgt für ge- 
nügend große n 


IF.) — Fb)| < ar IP.(a)— F(a)| < - 


Weiter folgt aus dem Lebesgueschen Satz vom Grenzübergang unter dem Inte- 
gralzeichen (vgl. Naransox [1]), wenn wir berücksichtigen, daß |P,(«) — F(«)| 
in jedem Intervall gleichmäßig beschränkt ist, die Gleichung 


lim Fir. _ Fü)! de = lim |F,(x) — F(a)| de. 


RR & 


Da die Funktion unter dem Integralzeichen auf der rechten Seite der letzten 
Gleichung gleich Null ist mit Ausnahme von (höchstens) abzählbar vielen Purk- 
ten, ist also das betrachtete Integral gleich Null. Es genüge t der Ungleichung 
T,<t<T,, wobei T, und T, zwei beliebige, aber fest gewählte Zahlen sind, und 
es sei X das Maximum der beiden Zahlen |7,| und |7,|, X = max (7, |, |7,}). 
Für genügend große n und alle betrachteten t ist dann 


b b 
MfImW-Folisk||ne-F@lde<z. 
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Also erhalten wir 
2 E 2 
(Ing — Tal < = (6.6.2) 


Weiter betrachten wir die Differenz 


Kkehs f etz UP „() — F etz dF (x). 
Es ist 
Im hi [dr + [dF@) = F,() + F(a). 


Ist aber der absolute Wert von «@ hinreichend groß, so folgen für genügend 
große n aus der Stetigkeit von F(x) im Punkt «a und aus der Voraussetzung 
unseres Satzes die Beziehungen 


F,(a) < F(a) ee 


= 
6 ’ 
also gilt für alle # und für genügend große n 
& 
In ee (6.6.3) 
Ebenso folgt 
| Ina — Ial = | (6.6.4) 


Aus den Formeln (6.6.1) bis (6.6.4) folgt die Behauptung des Satzes. 


Satz 6.6.1b (Umkehrung). Konvergiert die Folge von. charakteristischen Funk- 
tionen @„(t) an jeder Stelle t (—- oo <t<oo) gegen die Funktion p(t), die in einem 
gewissen Intervall |t| < r stetig ist, dann konvergiert die Folge der entsprechenden 
Verteilungsfunktionen F„(x) gegen die Verteilungsfunktion F (x), die die Funktion 
p(t) als charakteristische Funktion. besitzt. 


Beweis. Zum Beweis benutzen wir den Hellyschen Satz (siehe NaTanson [1]), 
der aussagt, daß jede Folge von Verteilungsfunktionen F,(x) eine konvergente 
Teilfolge {F,, (©)} enthält; der Grenzwert dieser Teilfolge ist eine nichtfallende . 
Funktion F (x), die in den Unstetigkeitsstellen so abgeändert werden kann, daß 
sie linksseitig stetig wird. Aus dem Hellyschen Satz folgt aber noch nicht, daß 
F(x) eine Verteilungsfunktion ist. Offenbar ist, da F(x) der Grenzwert einer 
Folge von Verteilungsfunktionen ist, 0<S F(«) <1; man weiß aber nicht, ob 
F(—-o)=0 und F (oo) =1 ist. Wir zeigen, daß dies in der Tat der Fall ist. 


6.6. Der Satz von L£vy und CRAMER 227 


Zu diesem Zweck nehmen wir an, das wäre nicht der Fall, so daß 
a=F(o) —- F(-o)<1 (6.6.5) 


wäre. Da aber 9,() > p(t) und 9,(0) =1 ist, folgt 9(0) =1. Weiter schließt 
man aus der Stetigkeit der Funktion 9 (t), daß in einer genügend kleinen Umgebung 
des Punktes = 0 sich p(f) wenig von Eins unterscheidet, so daß für genügend 
kleines 7 die Ungleichung 


1.) € € 
— t) dt 1—- — — 6.6.6 
| [eo > aut, (6.6.6) 
erfüllt ist, wobei die positive Zahl & so gewählt ist, daß a +e<1 ist. Da weiter 
die Teilfolge {F,,(x)} gegen F(x) konvergiert, folgt aus der Beziehung (6.6.5), daß 


man b > = (wobei —b und 5 Stetigkeitspunkte der Grenzverteilungsfunktion 
ET 


sind) und K so groß wählen kann, daß für k > K die Beziehung 


= F,.(b) = Fb) <a , 


besteht. 
Andererseits folgt aus der Beziehung (6.6.6) wegen @,(t) —>e(i), daß für 
genügend große k die Ungleichung 


(t) dt | >a+ = (6.6.7) 
| 
besteht. Wir zeigen, daß diese Ungleichung nicht erfüllt sein kann; denn es ist 
fe. ® di = f er dRF, (x) di = 1 | je di | dF,,(®). 


Wegen je*| =1 erhalten wir 


f eitz iu <A. (6.6.8) 


or 


Andererseits ist 


fer 2 En 


= lines. <, für || > 5. (6.6.9) 


=| 
ix i_, 


15* 
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Wir teilen jetzt die ganze x-Achse in zwei Teile, nämlich in die Punktmenge 
|e| = 5 und in die außerhalb dieses Intervalls liegende Punktmenge. Es ergibt sich 


F | Ni e" au |d,.@) | | fer dt \ar,.() 
lelsb Lt 


X rt 


Ef | [ea ar.n) 
lal>b 


— 


s 


Wenn wir für || sb die Ungleichung (6.6.8) und für |x| > 5 die Ungleichung 
(6.6.9) benutzen, erhalten wir 


i r 1 1 
a va|s ar,@|+-| [ar,@|lsa+- 
DT J "% ee) dr al ü # br 
€ [3 € € 
< — _ = i - (6.6.10 
za+ ä <a+ ni + 7 a+ FR ( ) 


Das ist ein Widerspruch zur Ungleichung (6.6.7). Die Funktion F (x) ist also eine 
Verteilungsfunktion. Aus dem zuerst bewiesenen Grenzwertsatz folgt, daß 

p(t) ihre charakteristische Funktion ist. 
“Nicht nur die Teilfolge {F,, (x)}, sondern auch die Folge {F„(x)} der Verteilungs- 
funktionen konvergiert gegen dieselbe Grenzverteilungsfunktion F (x). Wäre das 
nicht der Fall, so könnte man eine andere Teilfolge {F,()} finden, die gegen eine 
Grenzfunktion F (x) konvergiert, die nicht identisch gleich F(x) ist. Aus dem 
Gedankengang unseres Beweises folgt aber, daß F (x) eine Verteilungsfunktion 
ist, während aus dem Satz 6.6.1a und aus der Voraussetzung über die Konver- 
genz der charakteristischen Funktionen folgt, daß F (x) dieselbe charakteristische 
Funktion wie die Verteilungsfunktion F(x) hat; also besteht nach Satz 4.5.1 die 
Identität F(x)=F (x). Damit enthält jede Teilfolge von {F,(x)} eine Teilfolge, die 
gegen dieselbe Verteilungsfunktion F(x) konvergiert; die Folge {F„(x)} konver- 
giert also gegen F(x). 

Aus den Sätzen 6.6.1 a und 6.6.1b erhalten wir den 

Satz 6.6.1 (Lävv-Cramer). Es sei {X,) (n =1,2,3, ....) eine Folge von Zufalls- 
variablen, und F,„(x) bzw. @,(t) seien die Verteilungsfunktion bzw. die charakteristi- 
sche Funktion der Zufallsvariablen X,. Die Folge {F„(x)} strebt genau dann für 
n — 00 gegen die Verteilungsfunktion F (x), wenn in einem gewissen Werteintervall 
Ist die Folge {p,(t)} gleichmäßig gegen eine gewisse Funktion p(t) konvergiert. 
.. Die Grenzfunktion »(t) ist dann die charakteristische Funktion der Grenzverteilungs- 
funktion F(x), und die Konvergenz @,(t) > pt) ist gleichmäßig in jedem endlichen 
Intervall der t- Achse. 


Wir weisen darauf hin, daß der Satz 6.6.1 gültig bleibt, wenn wir voraussetzen, 
daß die Grenzfunktion e(f) nur an der Stelle =0 stetig ist (vgl. CRAmEr [2]). 
Des weiteren weisen wir darauf hin, daß wir im allgemeinen im Satz 6.6.1 die 
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Stetigkeit an jeder Stelle t im Intervall (— 00,00) durch die Stetigkeit in einem 
gewissen, den Punkt t = 0 einschließenden Intervall der t-Achse ersetzen können. 
Sind jedoch sämtliche Variablen X, wenigstens nach unten oder nach oben gleich- 
mäßig beschränkt, so genügt es für die Konvergenz der Folge {F„(x)} gegen die 
Verteilungsfunktion F(x), daß in einem gewissen Intervall |t!| <r die Folge 
{o„(f)} gegen die an der Stelle 2=0 stetige Funktion »(f) konvergiert. Der 
Beweis hierfür stammt von ZyemunxD [2]. 


6.7. Der Satz von Moivre-Laplace 


A. Zum Beweis des Satzes von MoIvRE-LAPrLAcE benutzen wir den Satz 6.6.1b. 


Mit {X,„} bezeichnen wir eine Folge von binomial verteilten Zufallsvariablen. 
Für jedes » kann die Zufallsvariable X, die Werte r =0,1,2,...,n annehmen, 
und ihre Wahrscheinlichkeitsfunktion wird durch 


- PX, =n= (een wobei 0O<p<ilundg=1-—-p, (6.7.1) 


gegeben. Bekanntlich ist nach den Formeln (5.2.4) 
E(X,)=n», DM(X,) = npg. 
Wir betrachten die Folge {Y,! der normierten Zufallsvariablen 


_ucnp 


Yn Zmmenca, 
npg 


(6.7.2) 


und beweisen: einen Grenzwertsatz, der nach MoIvrE und LAPLACE benannt 
ist. 


Satz 6.7.1. Es sei {F„(y)} die Folge der Verteilungsfunktionen der durch die 
Formel (6.7.2) definierten Zufallsvariablen. Y„. Hierbei sind die in (6.7.2) vorkom- 
menden X, nach der Formel (6.7.1) binomial verteilt. Wenn O <p<1 ist, gilt 
für jeden Wert von y die Beziehung 


y_u 
lim F,(y) = en J e ? dy. (6.7.3) 
n—00 Y2r 2 ö 


Beweis. Die charakteristische Funktion g,(f) der Zufallsvariablen X, hat 
wegen (5.2.3) die Gestalt 


9) = (g + pe). (6.7.4) 
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Nach (4.2.17) wird dann die charakteristische Funktion 9,() der Zufalisvariablen 
Y, durch 


an 


= £ exp (- 2 ) + pexp ( a | (6.7.5) 
\ Yang mp4 ; 
gegeben. 


Wir entwickeln e'® nach der Meylörschen Formel und benutzen die Restformel 
von PEANO: 


RT NR 
og! 


Daraus erhalten wir 
} > 2 2 EZ 
poxp (1 rer (t), 
Ynp n 2n n 


ao (- ma. ca j 
Yr»q Yn 2n n 


wobei für jedes £ die Beziehung 


2 ; A 
lim no (>) 0 (6.7.6) 
N 3 


N->X 


besteht. Wenn wir diese Werte in die Formel (6.7.5) einsetzen und die Gleichung 
»+qg=1 berücksichtigen, erhalten wir 


[il] 


Daraus folgt a. 
2 12 
log p,(t) = n log 1: —-——+ (=)| =nlog(l +2). 
2n n 
Da |z2| <1 für jedes feste t und genügend große # ist, können wir schreiben: 


[2 
log 9,() = —-—— gro .) 
n 
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Wenn wir (6.7.6) berücksichtigen, erhalten wir 


2 E 
lim log p,(t) = — —, also imo,(d=e?. 
NO 2 209 


Damit haben wir gezeigt, daß die Folge der charakteristischen Funktionen 
#,(t) der normierten Zufallsvariablen Y,, die durch die Formel (6.7.2) definiert 
sind, für 2 — oo gegen die charakteristische Funktion (siehe 5.7) einer normalen 
Zufallsvariablen konvergiert, deren Verteilungsfunktion durch die rechte Seite 
von (6.7.3) gegeben wird. Aus dem Satz 6.6.1b erhalten wir sofort die Formel 
(6.7.3). 

Da die Verteilungsfunktion einer normalen Delsiisväräblen keine Unstetig- 
keitsstellen hat, ist die in der Formel (6.7.3) betrachtete Konvergenz in jedem 
Punkt y vorhanden. Der Satz von MoIvre-LArLAce ist damit bewiesen. 


Es seien y, und %, zwei beliebige Punkte (y, <y,). Aus (6.7.3) folgt 
lim Py, <Y,< 9) = lim [F,(y) - Flyı)] = TE Je? ay. (6.7.7) 
n>X n>X 


Tyı 
Den Satz von Moıvre-LAPLAce wollen wir noch anders schreiben. Aus (6.7.2) 
erhalten wir nämlich 


\ 


7) 


Tr 


= P(y, Ynpg + np < X, <y, Ynpg + np), 


Py<TYn<y)=P (u <“ 


also 


— — 1 
lim P (y, Ynpg + np < X, < Ya Ynpg + np) =——— fe Re dy. 


2x . y2 T 


Wir führen die Bezeichnungen 


& =ylapa+np, %=ysYnpq+np (6.7.8) 


ein und schreiben die Formel (6.7.7) in der Gestalt 


i Be 
Pix, <X, <%) B® — fe 2 dy, 
2% Yı 


wobei y, und 3, aus den Formeln (6.7.8) bestimmt werden. 


Wir sagen, die Zufallsvariable X, sei asymptotisch normal N (np; Ynpa) ver- 
teilt. - 
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Ersetzen wir y, bzw. y, durch 
1 
2Ynpq 2Ynpq 


so erhalten wir eine etwas bessere Näherung. 


Yıt 


bzw. 9% — 


Beispiel 6.7.1. Wir werfen 100mal ein Geldstück. Dem Erscheinen des Adlers schreiben 
wir die Zahl Eins, dem Erscheinen des Kopfes die Zahl Null zu. Die Wahrscheinlichkeit 
jedes Ereignisses beträgt p = q = 0,5. Wie groß ist die Waährscheinlichkeit dafür, daß der 
Adler mehr als 50mal und weniger als 60mal erscheint? 

Die Zufallsvariabie X, kann hier die Werte von 0 bis 100 annehmen. Es ist 


E(X,)=50, DMX,)=25, 


50-50 X,-50 60-50 
P60<x,< 0 =P( < z , 
1,9 
Pl<&<ı) : 34 
= u Ss N — e % 
5 y2r 
—0,1 


Den Tafeln für die Normalverteilung entnehmen wir den Wert dieses Integrals; er beträgt 
0,4315. 


B. Aus dem Grenzwertsatz von MoıvRE-LArLAce für eine Folge von Zufalls- 
variablen mit Binomialverteilung erhalten wir einen ähnlichen Grenzwertsatz 
für die Folge der Zufallsvariablen 


X 


u-- 
N 


’ 


wobei X, eine durch die Formel (6.7.1) gegebene Binomialverteilung hat. 
Mit Z, sei die Zufallsvariable bezeichnet, die wir durch Normierung der 
Zufallsvariablen U, erhalten. Wenn wir betrachten, daß E(U,)=p und 


D2(U,) = pa ist, erhalten wird die Beziehung 
N 


wobei Y,, die durch (6.7.2) definierte Zufallsvariable ist. 
Da die Folge der Verteilungsfunktionen F,(y) der Zufallsvariablen Y, die 
Beziehung (6.7.3) erfüllt, gilt für die Folge der Verteilungsfunktionen F,(z) der 
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Zufallsvariablen Z, die Formel 


2 2 
lim F,() = Zr e 2 dz. 
2 Var 


Ebenso ergibt sich für beliebige Punkte 2, und 2, (2, < 2,) die Beziehung 


NO 


ED F_E 
im P(a <Yn ei, < ) "/‘ 2 da. (6.7.9) 


Wir setzen 


und schreiben (6.7.9) in Form der asymptotischen Gleichung 
u - 
Piu, < nme | 2 dz; (6.7.11) 
2% 


hierbei bestimmen wir die Werte 2, und 2, aus der Formel (6.7.10). 
Von der Zufallsvariablen U, die die Gleichung (6.7.11) erfüllt, sagen wir, daß 


sie eine asymptotische Normalverteilung N (r; ye) hat. 
n 
C. Das in 6.3 bewiesene Bernoullische Gesetz der großen Zahlen erlaubt nur die 
Feststellung, daß für jedes e > 0 die Wahrscheinlichkeit der Ungleichung 
X, 


iD 
% 


>e 


für n — 00 gegen Null strebt. Der hier bewiesene Grenzwertsatz,erlaubt uns, 
näherungsweise (für große rn) die Wahrscheinlichkeit dafür zu berechnen, daß der 


Wert der Zufallsvariablen Fam p im Intervall 
n 


(» yet = D , yet = 2) 


liegt; z, und 2, sind hier beliebige Zahlen (2, < 2,). 


Beispiel 6.7.2. In einem Kasten befinde sich eine Anzahl von Karteikarten der Arbeiter 
eines gewissen Industriezweiges. Unter diesen Werktätigen befinden sich 20%, junge und 
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80%, ältere Arbeiter. Wir greifen aufs Geratewohl eine Karteikarte heraus und notieren das 

auf der Karte angegebene Alter. Vor der Wahl der nächsten Karte legen wir die schon ge- 

wählte Karte in den Kasten zurück. Dann beträgt die Wahrscheinlichkeit, die Karte eines 

Jungarbeiters herauszugreifen, stets 0,2. Wir untersuchen auf diese Weise » Karten, Wie groß 

muß nun die Zahl » sein, damit mit einer Wahrscheinlichkeit von 0,95 die Häufigkeit einer 
Karte, die einem Jungarbeiter entspricht, zwischen 0,18 und 0,22 liegt? 

Die Häufigkeit einer Karte eines Jungarbeiters wollen wir mit U’, bezeichnen. Wir erhalten 
0,16 0,4 


E(U,) = 02, D(U,)= _ yD:v,) = m 
n 


und betrachten die Wahrscheinlichkeit 


-0,02 U,—-02 0,02 
P(0,18< U,< 0,22) = P 


en 
9,4//n 0,4/Yn 0,4/Yn 
zB (- 0,05 Yn < 7 Yn< 0,05 Y) = 0,95. 


Aus (6.7.9) ergibt sich 
0,05 Yn 2 
1 ur7 
0,95 = —— e "d2. 
y2r 
0,05% 


In den Tafeln für die Normalverteilung finden wir 


0,05 Ya» 1,96, also n x 1597. 


6.8. Der Satz von Lindeberg-Levy 


A. Der Satz von Moivk&-LAPrLAce ist, wie wir später sehen werden, ein Spezialfall 
eines allgemeineren Grenzwertsatzes, nämlich des Lindeberg-Levyschen Satzes. 

Wir betrachten die Folge {X,} (k =1,2,...) unabhängiger Zufallsvariabler, 
die alle dieselben Verteilungen und endliche Momente erster und zweiter Ordnung 
haben mögen. Wir setzen 


E(X,)=m, D2(X,)= 0? (6.8.1) 
und betrachten die Zufallsvariable Y,„, die folgendermaßen definiert wird: 
I, =X, +X%+::+X,. (6.8.2) 
Es ist 
E(Y,)=nm 
und, da die Zufallsvariablen X, unabhängig sind, 
D2(Y,) = noR. 


6.8. Der Satz von LinpEBErc-L£vy 235 


Die Zufallsvariable 
Ye 
Be Bm (6.8.3) 
en 

hat dann den Mittelwert 0 und die Standardabweichung 1. 

Nun beweisen wir den folgenden Satz von LINDEBERG-LE&vY (vgl. LINDEBERG [1], 
Levy [1]): j 

Satz 6.8.1. Haben die unabhängigen Zufallsvariablen X; Xa,.:. alle dieselbe 
Verteilung und eine endliche Standardabweichung o #0, dann erfüllt die Folge 
der Verteilungsfunktionen F,„(z) der durch die Formeln (6.8.3) und (6.8.2) defi- 
nierten Zufallsvariablen Z, für jeden Wert z die Beziehung 


Meet f e Edz. (6.8.4) 


Beweis. Wir schreiben die Gleichung (6.8.3) in der Form 
Rn 2 
Zn MEN zZ (X, — m). 
oVn #=-ı 


Alle Zufallsvariablen X, — m haben dieselbe Verteilung und somit auch dieselbe 
charakteristische Funktion o,(t). Die charakteristische Funktion 9,(t) der Zufalls- 
variablen Z, hat nach den Formeln (4.2.15) und (4.4.3) die Gestalt 


t n 
t) = ——||. 6.8.5 
9, E [; 7] ( ) | 


Wir haben die Existenz des Moments zweiter Ordnung vorausgesetzt, und es ist 
E(X,—-m)=0 und D?(X, = m) = 0°, 


also können wir die Funktion o,(f) in der Umgebung des Punktes t =0 folgender- 
maßen nach der Maclaurinschen Formel entwickeln: 


9) = - 7 ot + ol). (6.8.6) 


Wenn wir den Ausdruck (6.8.6) in dic Formel (6.8.5) einsetzen, erhalten wir 


011-3. +0(2)]: 
Y/7 


dabei ist für jedes endliche t 


p 
lim no (2) =(. (6.8.7) 
n i 


Nn>XO 
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Wir setzen 


dann ergibt sich 
2 2 t2 2 
log px!) = nlog(l +0) —n E- # ()| a +mo(). 
2n n n n 


Wenn wir die Beziehung (6.8.7) beachten, erhalten wir daraus 


RB 
lim logo,(t)=—- —, 
N->00 3 
also 
_# 
imot)=e *. 
N—>0O 


1? . x 
Der Ausdruck e ? ist die charakteristische Funktion einer Zufallsvariablen mit 
einer Gaußschen Verteilung. Wenn wir noch den Satz 6.6.1b benutzen, folgt, daß 
die Beziehung (6.8.4) erfüllt ist. Der Satz von LIvpEBERG-L&vy ist damit bewiesen. 


B. Es seien 2, und 2, zwei beliebige Zahlen (2, < 2,). Aus (6.8.4) ergibt sich 


lim Piz, <Z, <2) = lim [F2(2) — Fa (zı)] = un il e ?dz. (6.8.8) 
N>X y 27 


Nn>X 


*1 


Den Satz 6.8.1 formen wir um. Wir erhalten nämlich aus (6.8.3) 
Pa<n<m-rln<® <=) 
oyr 
=P (21 0 Yn + nm<Y,< 2,0 /n + nm). 
Aus (6.8.8) folgt dann 


2a 


— 1 _& . 
lim P (= seen +) Seel ee; (6.8.9) 
n-—>00 ö oYyn Y2r 


2 


Wir führen die Bezeichnungen 


Yı = 210 /n 2 nm, %= 2,0 /n +nm (6.8.10) 
ein und schreiben (6.8.9) in Gestalt der asymptotischen Gleichung 


%2 


1 BERN 
Py< ne |e 2 de. 
T 


621 
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Hierbei bestimmen wir 2, und z, aus den Formeln (6.8.10). Die durch die Formel 
(6.8.2) definierte Zufallsvariable Y,, hat also die asymptotische Normalverteilung 
N (nm; oYn). 

Wenn eine Summe von Zufallsvariablen asymptotisch normal verteilt ist, 
sagen wir, daß für sie der zentrale Grenzwertsatz gilt; also gilt für die betrachtete 
Summe .Y, der zentrale Grenzwertsatz. 


Beispiel 6.8.1. Nehmen wir an, die Zufallsvariablen X,(k = 1,2,...) seien unabhängig, 
und jede habe eine Zweipunktverteilung, d. h., für jedes k sei 


PX,=1)=p, P=)-1-p W<p<t. 
Wir betrachten die Giepzyertäileng der Zufallsvariablen 
Y,=-Xı tX%+'+X,- 
Wenn man berücksichtigt, daß E(X,)=»p und D?(X,)=pgq ist, ergibt sich aus dem 
Satz 6.8.1, daß die Zufallsvariable Y', im Limes nach N (np; Yrpgq) normal verteilt ist. 


Da die Zufallsvariable Y,„ binomial verteilt ist, ist dieses Beispiel eigentlich 
ein neuer Beweis für den Satz von MOIVRE-LAPLACE, der also, wie wir sehen, ein 
Spezialfall des Satzes von LINDEBERG-LEVY ist. 


Beispiel 6.8.2. Die Zufallsvariablen X, (nr = 1,2, ...) seien unabhängig und mögen dieselbe 
Poissonsche Verteilung haben, die durch die Formel 


ar 
PX,=n= ne (r=0,1,2,...) 


gegeben wird, Gesucht ist die Wahrscheinlichkeit dafür, daß der Wert der Summe Yo = Xı 
+ 2,4" + X,o größer als 190 und kleiner als 210 ist. 


Die Zufallsvariable Y';,, bat näherungsweise die Normalverteilung N (200 ‚10 Y 2), da jede 
der Zufallsvariablen X, die endliche Standardabweichung o= y2 und den Mittelwert 
m = 2 hat. Wir erhalten also 
Yzoo — 200 


oy2 
Aus den Tafeln für die Normalverteilung finden wir für die gesuchte Wahrscheinlichkeit den 
Wert 0,52. 


P(190 < Yo < 210) = P (-0,70 = < oo). 


€. Aus dem Satz von Linpuserg-Livv ergibt sich der 


Satz 6.8.2. Es seien X,, X, ... unabhängige Zufallsvariable mit derselben Ver- 
teilung, dem Mittelwert m und der Standardabweichung o #0, und es sei die 
Zufallsvariable U, durch 


_Kutrteti 


N 


U, 
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definiert. Weiter sei F„(v) die Verieilungsfunktion der durch 


v. de U, —— E(U,) 


YD:(d,) 


definierten Zufallsvariablen V,„. Die Folge der Verteilungsfunktionen F„(v) erfüllt 
dann die Beziehung 


v v2 i 
lim F,(v) = en e :dv. (6.8.11) 
n>X y2r B 
Beweis. Esist Z(U,)=m und D?(U,) =—. Daraus erhalten wir 


2 yuem Dem 
= N = + = ag 
C oyn 


wobei Z, die durch (6.8.3) definierten Zufallsvariablen sind. Da die Folge der 
Verteilungsfunktionen F,„(z) die Beziehung (6.8.4) erfüllt, erfüllt die Folge 
{F„(v)} die Beziehung (6.8.11). 

Es seien jetzt v, und v, (v, <v,) zwei beliebige Zahlen. Dann besteht die 
Beziehung 


vg 


im Po <V,<v) = un e ? dv. (6.8.12) 
Nn>X V2r 
73 
Wir setzen 
WW tm, WW —Htm. (6.8.13) 


y m 


Die Formel (6.8.12) schreiben wir in Form der asymptotischen Gleichung 
ı f- 
Piü <U,<w) u — |e de 
; Ver. 


wobei wir.die Werte v, und v, aus Sen Formeln (6.8.13) bestimmen. Die Veränder- 


2 ) also : ist 
N 


das arithmetische Mittel von n unabhängigen Zufallsvariablen mit derselben, aber 
beliebigen Verteilung, für die wir nur die Existenz des Moments zweiter Ordnung 
voraussetzen, asymptotisch normal verteilt. 


lichen U,„ haben die asymptotische Normalverteilung \(m; 
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Beispiel 6.8.3. Die Zufallsvariablen X,, X,, ..., X, seien unabhängig und gleichverteilt; 
ihre Dichte ist also von der Form \ 


4) 1 für x aus dem Intervall [0,1], 
1 —— 

0 für x<0O undz>1. 
Nach den Formeln (5.6.4) und (5.6.5) ist _ 


Wir betrachten die Zufallsvariable 


Kt&trti, 
Ya. 


ı 1 
Wegen Satz 6.8.2 sind die Zufallsvariablen Y,„nach N gi Yin asymptotisch normal ver- 
12% 


teilt. Wir berechnen für » = 48 die Wahrscheinlichkeit dafür, daß der Wert der Zufalls- 
variablen Y', kleiner als 0,4 ist. 


Es ergibt sich!) 


PrR<0M=P| —— < — EEE 


576 576 \ 24 
» ® (2,4) » 0,0082. 


Obwohl die Zufallsvariablen X, (k = 1,2,...) im Intervall [0, 1] gleichverteilt sind, hat 
jedoch, wie wir sehen, ihr arithmetisches Mittel eine Verteilung, in der Werte, die um mehr als 
ein Zehntel kleiner als m = 0,5 sind, äußerst selten vorkommen. 


Beispiel 6.8.4. Die Zufallsvariablen X, (r=1,2,...) seien unabhängig.und mögen dieselbe 
Verteilung haben. Die Zufallsvariable X, soll die Wertek = 0,1, ..., 9 mit den Wahrscheinlich- 
keiten P(X, = k) = 0,1 (für jedes r) annehmen können. 


Es ist 

1. 

mM E(X,) Ba k 4,5, 
05, 

1.8 1.2 

0 = DM(X,) = Pa (k — m)? = — > I? — m? —= 28,50 — 20,25 = 8,25, 

zer) 10 420 
also o = 2,87. 


Wir betrachten die Zufallsvariable 
X, +8,44 Xyoo 
Y 00 = 
100 


1) Die. Verteilungsfunktion einer nach N (0;1) normal verteilten Zufallsvariablen wollen 
wir mit ® bezeichnen. 
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Wie groß ist die Wahrscheinlichkeit dafür, daß der Wert der Zufallsvariablen' X,., größer 
als 5 ist? 


Wenn wir den Satz 6.8.2 benutzen, können wir schließen, daß die Zufallsvariable Yo 


2,87 
näherungsweise nach N (6 =) normal verteilt ist. Wir erhalten also 


> Yoa-45 5-45 Yo 45 
P(Y DIR 22, Wien BEBMoaiE Ne ARE Ve »7 az. BER 0,7 
u | 0,287 0,287 07 


rs 1 — ©(1,74) z 0,041. 


Ähnliche Fragen, wie sie in diesem Beispiel besprochen wurden, treffen wir 
häufig in der Statistik bei der Benutzung von Tafeln zufälliger Zahlen an. Von 
diesen Tafeln wird noch in Kapitel 14 die Rede sein. 


D. Wir zeigen an einem Beispiel, daß das arithmetische Mittel von n Zufalls- 
variablen mit derselben Verteilung nicht asymptotisch normal verteilt zu sein 
braucht; das ist dann der Fall, wenn kein endliches Moment zweiter Ordnung 
existiert. 


Beispiel .6.8.5. Die Zufallsvariablen X, (k=1,2,...) seien unabhängig und mögen 
dieselbe Cauchysche Verteilung haben, die durch die Formel (5.10.3) definiert ist. Da die 
charakteristische Funktion der Zufallsvariablen X, für jedes % gleich @,(t) = e!!! ist, nimmt 
die charakteristische Funktion o(f) der Zufallsvariablen 


Y SKSrhtnmt 


n 


die Form 


o)= e nn = e-itl 


an; für ein beliebiges n hat also die Zufallsvariable Y,„ eine Cauchysche Verteilung und ist 
nicht asymptotisch normal verteilt. 


Wir erinnern aber daran, daß eine Zufallsvariable mit einer Cauchyschen Verteilung 
keine endliche Standardabweichung besitzt (siehe 5.10). 


RB. Es mögen die Zufallsvariablen X, (k =1,2,3,...) den Voraussetzungen des 
Satzes 6.8.1 genügen, und essei Z{X,) = 0. Wir betrachten für jedes r die Teil- 
summen Zi 


j ; 
Sea, VEel 2a): 
k=1 
Erpös und RKac [1], [2] haben die Grenzverteilungen der Folgen 


| mx el, max DI}, 1428 
ısisuYn 1gj&n Vn ne j<ı 


gefunden, Ihre Artikel stellen den Anfang einer Reihe von fruchtbaren Arbeiten 
dar, die die Grenzverteilungen einer weiten Klasse von Funktionalen, die auf 


PL) 


m: gel 
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den Vektoren ($,, ..., $„) definiert sind, betreffen. Dabei sind die Voraussetzungen, 
die die Zufallsvariablen X, betreffen, bedeutend allgemeiner als diejenigen, die wir 
angenommen haben. Hier wollen wir diese Ergebnisse nicht weiter behandeln, 
sondern nur auf die erwähnten Arbeiten von ErDös und Rac sowie auf die Arbeiten. 
von Donsker [1], PRocHoRoWw [2], [3], SKOROCHOD [1], Spitzer [1], BAXTER und 
DONSKER [1], VARADARAJAN [1], LAMPERTI [1], BARTOSzYNsK1 [1], [2] und Biniınes- 
LEY [1] verweisen, 


6.9. Der Satz von Ljapunoff 


In 6.8 untersuchten wir die Grenzverteilung einer Summe von unabhängigen 
Zufallsvariablen mit derselben Verteilung und steliten fest: Haben die Zufalls- 
variablen ein endliches Moment zweiter Ordnung, denn ist ihre Summe asyın- 
ptotisch normal verteilt. Aber die Verteilung einer Summe von unabhängigen 
Zofallsvariablen mit verschiedenen Verteilungen braucht nicht gegen eine Nor- 
malverteilung zu konvergieren, sogar dann nicht, wenn alle Zufallsvariablen 
endliche Standardabweichungen haben. 

Wir beweisen jetzt einen Satz von LJAPUNorrF [2], der eine hinreichende Be- 
dingung dafür angibt, daß eine Summe von unabhängigen Zufallsvariablen 
asymptotisch normal verteilt ist. 


A. Wir betrachten eine Folge {X,} (k=1,2,...) von unabhängigen Zufalls- 
variablen, die endliche Momente dritter Ordnung haben. 


Satz 6.9.1 (LJArunorrF). Es sei {X,} eine Folge von unabhängigen Zufallsvaria- 
blen, deren Momente dritter Ordnung existieren, und my, 0% #0, a, und b, seien der 
Mittelwert, die Standardabweichung, das zentrale Moment dritter Ordnung bzw. das 
absolute zentrale Moment driiter Ordnung der Zufallsvariablen X,. Wir setzen 


30 / a, 
Bi - 2% = \ or. 
=ı 
Wenn die Bedingung 


eo (6.9.1) 


n—X Un 


erfüllt ist, genügt die Folge der Verteilungsfunktionen F,„(z) der Zufallsvariablen 


Zu —_t=1 (6.9.2) 


16 Fisz 
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für jedes z der Beziehung - 
: 1 -Z 
lim F,@) = —— Je? de. (6.9.3) 
n—X0 y E74 
Beweis. Wir setzen 


ya 


Mit 9,,(®) sei die charakteristische Funktion der Zufallsvariablen X, — m; 
bezeichnet. Da E(X,— m.) =0 ist und die Momente o? und «a, existieren, 
können wir nach Formel (4.3.2) die Funktion @,, (f) in die Summe 


R 2 
71 4 ine + oa) 


entwickeln. Die charakteristische Funktion o,,(f) der Zufallsvariablen Y,. ist nach 
Formel (4.2.15) gleich 


ü 41? 7 . a,t? 
Py. (%) =. (o,) == ! >= 208 + 60: (i)? +0 | z| -1-+ u. 


n 


Für jedes endliche t ist 


3 3 
lim £ 2 ) 7 0. | | (6.9.4) 


a 3.— 
Da im Sinne der Ljapunoffschen: Ungleichung (3.4.2) o, S Yb. ist, folgt aus der 
Bedingung (6.9.1), daß für jedes endliche t 


3, 
249 2 2 
. —oyt B y e 1B 
ea 2 ng . 
ist. Weiter erhalten wir 
|: br . Balt]? 
ea ans = 


Aus den Beziehungen (6.9.5) und (6.9.6) folgt 


lm u, = 0; 
NO 
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dabei ist die Konvergenz gleichmäßig in bezug auf k. Für jedes { existiert also eine 


1 
Zahl N = N(t) derart,daßfür n> N undalle k<n die Ungleichung u|l<z 


besteht. Wir erhalten also 


le) -lelt+m)=- 7-7 m 
ur 2 9 
RER 


Es gilt die Ungleichung 


2 2 
misirziwlt Zune +j%|+]%,|?-+ 


Man kann also 


log p.() = u + dru? 


schreiben, wobei 9%, = = und |9,| <1 ist. 


Wir bezeichnen mit 9,(t) die charakteristische Funktion der Zufalisvariablen Z,. 


Auf Grund der Formel (4.4.3) ist 9,() = [J] p,,(b), also 
k=1 


log 9() = > log Pyr (d). 
k=1 
Aus der Gleichung (6.9.7) erhalten wir 


log 9, (t) = I (ur + Hu). 
= 


Weiter gilt 
” B n ar (v1)? n Ra 
%=—- + t 0 . 
2 z 2 2 60% 2 E 
Für jedes endliche : ist 
| Sat, Sa, Bi 
lim ———- |<lim = 
n—0o 2 n n->00 2 6C; no 7772 


2 
u 
med 
1 1 
.<1 N  ..— 
ran 
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(6.9.7) 


(6.9.8) 


(6.9.9) 


(6.9.10) 


Wenn wir die Formel (6.9.4) beachten, erhalten wir also 


Q,1° a,t® 
lım 0 lim -101—)]: 
im 3 (#)- N—>00 n Sl | e 


 16* 


|} =(. (6.9.11) 


244 6. Grenzwertsätze 


Nach Berücksichtigung der Beziehungen (6.9.10) und (6.9.11) folgt aus (6.9.9) 
für jedes endliche t 


n 
im Yu =—-. 5 (6.9.12) 
no k=1 & 2 Br 
Wir wollen jetzt den Grenzwert der Summe 
ot a,lih)? a,t? 


n 2 
en BEE BER _—— 
Ze=2]| 20: "90 Ir ) 


bestimmen. Aus der Ljapunoffschen Ungleichung (3.4.2) unter der Bedingung 
(6.9.1) ergibt sich 


3 
z f# — lim en 


>89 k=ı 4 re Nn>X m 2 40, n>o k= 403 C, 2 
(6.9.13) 
B3 0, 
< lim * - im — HM — 
Nn>X > a Nn>X 403 
|r 2 (68)® - n a;1® n b218 Bit 6 

=o0. 6.9.14 

n->00 im 2% "al|s = im ;| = 35 im > = KumETTGT ( ) 


Also ist bei Berücksichtigung der Formel (6.9.4) erst recht 


, n a8? 3 B 
Fass 26a)! —=0. (6.9.15) 


Ebenso erhalten wir die Beziehungen 


n—ı n 2 ‚43 £5 
lim RT =0, (6.9.16) 
n>o|k=1 j=k+1 60, 

a1 nn 2 2 „3 
im|y 5 el] =0, (6.9.17) 
n>o@|k=1 j=k+1 C, C, 5 

n—1 n a 4313 a; 
lim AAN 6.9.18 
RX 2, 2: 30% | Go ) H 


Wenn wir die Formeln (6.9.13) bis (6.9.18) berücksichtigen und beachten, daß 
19%] <1 für jedes kn ist, so erhalten wir . 


im Yu =0. (6.9.19) 


n>0© k=1 
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Aus (6.9.8) folgt, wenn wir die Formeln (6.9.12) und (6.9.19) berücksichtigen, daß 
für alle t die Beziehung 


t2 

lim log o,(t) = — < 

Nn—>00 2 
gilt; also ist 

© 

lim o,{t) = e?. 

Nn>X 
Aus der letzten Beziehung ergibt sich auf Grund des Satzes 6.6.1b die Formel 
(6.9.3). Der Satz von LJAPUNOFF ist damit bewiesen. 

Falls die Bedingung (6.9.1) erfüllt ist (dies ist oft bei praktischen Problemen der 
Fall), ist auf Grund des Ljapunoffschen Satzes eine Summe von unabhängigen 
Zufallsvariablen auch dann asymptotisch normal verteilt, wenn nicht alle Sum- 
manden die gleiche Verteilung haben. 

Einen anderen Beweis für den Satz von LJAPUNOFF findet der Be in einer 
Arbeit von PARzen [2]. 


B. Der Ljapunoffsche Satz gibt aber nur eine hinreichende Bedingung dafür an, 
daß die Beziehung (6.9.3) gilt. Wir führen jetzt ohne Beweis den Satz von LisDe- 
BERG-FELLER an, der eine notwendige und hinreichende Bedingung angibt. Der 
Leser findet den Beweis in den Originalarbeiten von LInDEBEre [1] und Feırer [2] 
oder auch im Buch von GNEDENKOo [6] oder Lo&va [4]. 


Satz 6.9.2 (LINDEBERG-FELLER). Es sei {X} (k=1,2,...) eine Folge von 
unabhängigen Zufallsvariablen, und G,(x), m; bzw. 0, #0 seien die Verteilungs- 
funktion, der Mittelwert bzw. die Standardabweichung der Zufallsvariablen X. 
Weiter sei 


Unter diesen Voraussetzungen gilt die Beziehung lim max ee 0, und die 
2009 1Sksn n 

Folge der Verteilungsfunktionen F,(z) der normierten Zufallsvariablen Z,, die durch 

die Formel (6.9.2) definiert sind, erfüllt die Beziehung 


z 
z* 


lim F,(z) = Sr e ? dz 


genau dann, wenn für jedes e>0 die Beziehung 


lim aa BE T (x — m)? dGy(x) = 0 (6.9.20) 
n>X Unk=1 Ie-mıl>eC, ; 


gilt. 
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Wenn alle Zufallsvariablen X, stetig sind und g, (x) die Dichte der Zufallsvaria- 
blen X, ist, nimmt die Bedingung (6.9.20) die Form 


= 2 (0 — my)? gu (x) da = 0 (6.9.21) 


k=1 Ie-mıl>eC, 


lim 
an. Wenn dagegen alle Zufallsvariablen X, diskret sind, die Sprungstellen x: 


und die Sprunghöhen 9 (=1,2,...) besitzen, so nimmt die Bedingung (6.9.20) 
folgende Form an: 


n 


Re! 
im 5 5 (m mp = 0. (6.9.22) 
soo Un k=1 |2za-m,!>EC, 


Aus dem Lindeberg-Fellerschen Satz folgt 


Satz 6.9.3. Essei {Xu} (k =1,2,...) eine Folge von unabhängigen Zufallsvaria- 
blen, die gleichmäßig beschränkt sind, d. h., es gibt eine Zahl a > 0 derart, daß für 
jedes k 


PiXI<a)=1 . | (6.9.23) 


ist, und es sei D*(X,) #0 für jedes k. Dänn gilt die Beziehung (6.9.3) genau dann, 
wenn 
lim 02 = oo 4 (6.9.24) 
NR 
ist. 
Beweis. Es sei (6.9.24) erfüllt. Aus (6.9.23) folgt, daß die Zufallsvariablen 
X, — m, gleichmäßig beschränkt sind; also kann man für jedes e>0 ein N 
derart finden, daß für n> N 


P(IX, —m|<eln; k=1,2,..,n)=1 


gilt. Daraus folgt sofort (6.9.20). 
Es geite nun die Beziehung (6.9.3), aber (6.9.24) sei nicht erfüllt. Es existiert 
also ein C < oo derart, daß ; 


lim 0? = 0? 


n->00 
x 

ist. Hieraus und aus den Beziehungen (6.9.3) und (6.9.2) folgt dann, daß 3) (X, — m;) 
k=1 


eine Normalverteilung N(0;C) besitzt (vgl. Aufgabe 6.16.43). Wir setzen 
U=(X,— ms) + (X, — m;) +. Die Zufallsvariablen X, — m, und U sind 
unabhängig, und ihre Summe ist normal verteilt. Nach einem Satz von CRAMER 
([1], Satz 19) sind beide Komponenten einer solchen Summe normal verteilt. Da 
aber wegen (6.9.23) die Zufallsvariable X, — m, nicht normal verteilt sein kann, 
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kann auch die Beziehung (6.9.3) nicht erfüllt sein. Damit ist der Satz 6.9.3 be- 
wiesen. 


Aus diesem Satz folgt insbesondere: Die Zufallsvariablen 
n=J X 
kl 


mögen eine verallgemeinerte Binomialverteilung besitzen, d.h., die Zufalls- 
variablen. X,seien unabhängig, und jede von ihnen habe eine Null-Eins-Verteilung, 
deren Wahrscheinlichkeitsfunktion durch 


PX =1)=p, PX =-)=-4g=-1-m k=1,2,...) 


gegeben wird, 
Aus den Formeln (5.1.8) und (5.1.9) ergibt sich hier 


n n 
m. =EX)=-m, #%=DX)=pm A=ln=N MR: 


Die Divergenz der Reihe 
2 Pr9k 
k-1 


ist dann notwendig und hinreichend dafür, daß die Zufallsvariable Y, asym- 
ptotisch normal nach 


Rn n 
N (£ Pr U 2a) 
k=1 k=1 
verteilt ist. 


Beispiel 6.9.1. Auf einer Baustelle sind Ziegel aus verschiedenen Ziegeleien gestapelt. 
Man nimmt auf Grund der beobachteten Qualität der zuletzt gelieferten Ziegel an, daß der 
Ausschuß, d. h. der Anteil der fehlerhaften Ziegel in einer Lieferung, nicht in allen Lieferungen, 
die aus verschiedenen Ziegeleien stammen, der gleiche ist. Bei der Produktion der »-ten 
Ziegelei sei 2; der Anteil der fehlerlosen Ziegel. Die Werte von p, seien 


2, = 0,95, 2, = 0,90, : 9 = 0,8, = 0,92, 25 = 0,9%. 


Die Wahrscheinlichkeit, einen fehlerlosen Ziegel atıs einer Lieferung, die aus der i-ten Ziegelei 
stammt, herauszugreifen, beträgt »,. Es sollen alle aus ein- und derselben Ziegelei stammenden 
Ziegel auf einem Stapel liegen. Wir greifen nun aufs Geratewohl aus jedem Stapel 20 Ziegel 
heraus. Da die Stapel sehr groß sind, ändert das Wegnehmen von ein paar Ziegeln kaum die 
Zusammensetzung eines Stapels. Wir können also annehmen, daß die Wahrscheinlichkeit, 
einen fehlerlosen Ziegel aus dem i-ten Stapel herauszugreifen, konstant bleibt und 9, beträgt. 
Bei der Qualitätsuntersuchung aller 100 Ziegel zeigte es sich, daß 11 Ziegel Ausschuß waren. 
Dieses Ergebnis weckte in uns einigen Zweifel, ob unsere Annahmen hinsichtlich der Werte 
p; nicht zu optimistisch waren. 
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Das mathematische Modell dieses Beispiels sieht folgendermaßen aus: 

Wir haben 100 unabhängige Zufalisvariable X, und jede kann zwei Werte annehmen, 
den Wert Eins (wenn ein fehierloser Ziegel vorkommt) und den Wert Null (wenn ein fehler- 
hafter Ziegel vorkommt). Diese Zufallsvariablen sind in 5 Gruppen eingeteilt. Zur ö-ten 


Gruppe gehören diejenigen Zufalisvariablen, die mit der Wahrscheinlichkeit »,; den Wert i 
annehmen. Wir bilden die Summe 


Fat trete tigt tot fate+ Kot Lat + Fe 
+ Lat + As: 
Das ist eine Zufallsvariable mit einer verallgemeinerten Binomialverteilung. Wir erhalten 


Z(7 0) = 20 - 0,95 + 20 - 0,90 + 26 - 0,98 +20 - 0,92 -- 20 - 0,96 = 94,20, 
a, 0,05 - 0,95 + 20 - 0,10 - 0,90 -+ 20 - 0,02 - 0,98 + 20 - 0,08 - 0,92 
+ 20 - 0,04 - 0,96 


= 5,382, 
a = 2,32. 


Bevor wir den zentralen Grenzwertsatz anwenden, müssen wir unsere Aufmerksamkeit 
dem vorhin erhaltenen Ergebnis zuwenden. Danach war für die Konvergenz einer Zufalls- 
variablen mit einer verallgemeinerten Binomialverteilung gegen die Normalverteilung not- 
wendig und hinreichend, daB die Reihe & 249, Aivergiert. Wenn diese Reihe konvergiert, 


strebt p,g, für k—o0 gegen Null, also au min(p„,1— p,) > 0 gelten. Die Folge {p,} muß 

also entweder eine Teilfolge enthalten, die gegen Null konvergiert; oder eine Teilfolge, die gegen 

Eins konvergiert, Für unser Beispiel bedeutet das: Die Reihe 7,9, konvergiert dann, 
PJ 


wenn sehr häufig (theoretisch unendlich oft) Ziegellieferungen ankommen, die entweder nur aus 
fehlerlosen Ziegeln oder nur aus Ausschuß bestehen. Wie die vieljährige Praxis der Ziegel- 
produktion und die von uns erhaltene Anzahl fehlerhafter Ziegel zeigt, tritt hier keiner der 
Fälle ein, für den die i ee ZiPetk konvergiert. Man kann also den zentralen Grenzwertsatz 
anwenden. 


Auf Grund dieses Satzes hat die Zufallsvariable Y 100 näherungsweise die Normalverteilung 
N (94,2;.2,32). Es ist also 


Yo —M,2 
PYo=89)-P Fr = -225) = d(—2,25). 


Der Tafel für die Normalverteilung entnehmen wir, daß der Wert © (—2,25) sehr klein ist, 
er beträgt ungefähr 0,91. In derartigen Fällen sind wir geneigt zu schließen, daß die für »; 
angenommenen Werte doch zu optimistisch waren. 


Mit diesem Beispiel sind wir unseren Darlegungen ein wenig vorausgeeilt. 
Fragen dieser Art werden im zweiten Teiü des Buches großen Platz einnehmen 
und dort systematisch behandelt werden. Das Beispiel brachten wir, um zu 
zeigen, daß der zentrale Grenzwertsatz nicht nur ein schönes mathematisches 
Ergebnis ist, sondern auch zur Lösung vieler praktischer Fragen dient. 
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©. Aus den Betrachtungen von 6.6 bis 6.9 erkennen wir, was für eine hervorragende 
Rolle die Normalverteilung in der Wahrscheinlichkeitsrechnung und deren An- 
wendungen spielt. 

Nun wollen wir jedoch einen Satz bringen, der zeigt, daß unter ziemlich all- 
gemeinen Voraussetzungen die Folge der Verteilungsfunktionen einer Summe 
von unabhängigen Zufallsvariablen gegen eine Verteilungsfunktion streben 
kann, die von der Normalverteilung verschieden ist. Wir erinnern daran, daß wir 
in 6.1 Arbeiten erwähnten, in denen die Probleme, die mit den Verteilungen von 
Summen unabhängiger Zufellsvariabler zusammenhängen, in vollem Umfange 
gelöst werden. 

.Wir betrachten eine Folge {Y,} (n=1,2,3,...) von Zufallsvariablen, wobei 


Y,„ für jedes n dieSumme von n unabhängigen Zufallsvariablen X,,.(k=1,2,...,) 
ist: 
Y.=3 Au: (6.9.25) 
k=1 


Diese Summen sind allgemeiner als die bis jetzt in diesem Kapitel behandelten 


Summen. Es war nämlich 
> 


Keil Beid.,n. 


Die Zufallsvariablen X,, (k =1,2,...,r) sollen für jedes » die gleiche Ver- 
teilung!) haben, die durch die Wahrscheinlichkeitsfunktion 


PX = =) = Pal (d = 1, 2; re r) j (6.9.26) 


gegeben sei, wobei 
Is msi, Zul 
l=1 


und r (r 2 2) irgendeine natürliche Zahl ist. 


Satz 6.9.4. Es sei Y „durch die Formel (6.9.25) definiert, und die Zufallsvariablen 
Xu (k=1,2,...,n) seien unabhängig mit derselben durch die Formel (6.9.26) 
gegebenen Verteilung. Ferner bezeichne F,(z) die Verteilungsfunktion der durch 


_Y-Eln) 
Der) 
definierten Zufallsvariablen Zu. Dann gilt: 
1. Wenn die Beziehung 


lim | Pa1 Pna + PraPns + °*° + Pn,-ı Par] = 00 (6.9.27) 
n->09 


1) Den Fall, daß die Zufallsvariablen X,, nicht die gleiche Verteilung für alle k aufweisen, 
hat Kvsık [1] untersucht (siehe Aufgabe 6.16.17). 
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erfüllt ist, genügt die Folge {F„(z)} der Beziehung 
3 ; 
lim F„(z) = Van exp (-3) de. 


2. Wenn die (endlichen oder unendlichen) Grenzwerte 


lim 2, und Km np '(d=1,2,...,r) 


RO Nn>X 


existieren und die Beziehung 


lim %[Prı Pa + PraPns + "+ Pn,r-1 Par] = A (6.9.28) 
NR 


mit A>0 erfüllt ist, konvergiert die Folge {F„(2)} gegen die Verteilungsfunktion 
einer Zufallsvariablen, die die Summe vons (1 Ss sr — 1) unabhängigen Zufalls- 
variablen ist, die entweder eine Poissonsche Verteilung besitzen oder lineare Funk- 
tionen von Zufallsvariablen mit Poissonschen Verteilungen sind. 


“ Dieser Satz wurde von Fısz [2] bewiesen. 
In Satz 5.5.1 traten Summen der Form (6.8.25) auf. Es war nämlich Y, die 


Anzahl der Erfolge in n Versuchen eines Bernoullischen Schemas, und die Wahr- 
scheinlichkeit p, eines Erfolges war eine Funktion von n, die der Beziehung 


lim np, = A : (6.9.29) 


N>OO 


genügte, wobei A>0 war. Wir können dann schreiben: 


n 
Y,= > Apr; 


k=1. 


dabei ist X,; gleich der Anzahl der Erfolge (gleich Eins oder Null) beim k-ten 
Versuch; die X, sind also unabhängig und haben die gleiche, durch 


PX =1) = Da = m» 
PXu=0) = m =1— m 


gegebene Verteilung. Hier it r—=2. Aus der Formel (6.9.29) folgen die 
Beziehungen 

lim %ı =0, Impa =] 

imnpı =4, \mrpa=%;, 


RX No 


lm n Pa Pas = 
00 


n— 
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“ wonei A > 0 ist. Damit sind alle Voraussetzungen des zweiten Teils von Satz 
6.9.4 erfüllt. Die Folge {F„(z)}, wobei F'„(z) die Verteilungsfunktion der Zufalls- 
variablen 


Yan — NP 


Zu = se, 
Vnp.(l — P.) 


ist, strebt also gegen die Verteilungsfunktion einer Zufailsvariablen mit einer 
Poissonschen Verteilung (der Parameter ist hier gleich A). Das ist der globale 
Poissonsche Satz (vgl. 6.1), während der Satz 5.5.1 den lokalen Poissonschen Satz 
darstellt. 


D. Neben der Feststellung, daß die Folge {F,,(z)} der Verteilungsfunktionen der 
durch. (6.9.2) gegebenen Zufallsvariablen Z, gegen die Verteilungsfunktion 
D(z) der Normalverteilung konvergiert, ist es wichtig abzuschätzen, wie rasch 
diese Konvergenz erfolgt. Mit anderen Worten, es geht darum, die Differenz 
|Fa(2) — © (2) | für alle » und alle z abzuschätzen. Der Leser findet die weit voran- 
getriebene Lösung dieser Probleme für binomial verteilte Z,, in den Arbeiten von 
UsPpenski [1] und FerLee [11] und für den allgemeinen Fall in den Arbeiten von 
CRAMER [1], [3], Esszen [1] und Berry [1] (siehe Aufgabe 6.16.19). 
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A. In diesem Kapitel haben wir uns bis jetzt nur mit der Konvergenz von Folgen 
von Verteilungsfunktionen einer Summe von normierten Zufallsvariablen gegen 
eine Grenzverteilungsfunktion beschäftigt. Im allgemeinen folgt jedoch aus der 
Konvergenz der Folge der Verteilungsfunktionen gegen eine normale Verteilungs- 
funktion nicht, daß ein „lokaler Grenzwertsatz“ gilt, d. h., die Folge der Dichten 
(wenn die behandelten Zufallsvariablen stetig sind) bzw. die Folge der Wahr- 
scheinlichkeitsfunktionen (wenn die Zufallsvariablen diskret sind) braucht nicht 
gegen die Grenzdichte bzw. die Wahrscheinlichkeitsfunktion zu konvergieren 
(vgl. Aufgabe 6.16.25 und 6.16.26). 

Hier wollen wir uns nicht mit der Frage in ihrem ganzen Umfange beschäftigen, 
sondern nur für besondere Folgen von unabhängigen diskreten Zufallsvariablen 
einen lokalen Grenzwertsatz beweisen, und zwar für Folgen von unabhängigen 
diskreten Zufallsvariablen, die alle dieselbe Verteilung haben und nur Werte der 
Form «+ hk annehmen, wobei A > 0 ist und % (nicht notwendig alle) ganzzahlige 
Werte durchläuft. Eine solche Verteilung nennen wir götterförmige Verteilung und die 
Zahl h die Schrittweite der Verteilung. Die Schrittweite A ist offenbar gemeinsamer 
Teiler der Differenzen der Wertepaare, die die Zufallsvariable X; annehmen kann. 
* Wir nennen h die maximale Schrittweite, wenn h der größte gemeinsame Teiler der 
genannten Differenzen ist. Zunächst werden wir diejenigen diskreten Zufalls- 
variablen betrachten, die nur ganzzahlige Werte annehmen können. 
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Satz 6.10.1 (GwEpEnKo [5]). Die unabhängigen diskreten Variablen X, 
(=1,2,...) mögen alle dieselbe Verteilung haben und mit positiver Wahrscheinlich- 
keit ganze Werte annehmen, undessei E(X,)=m sowie D%M(X,) =0?2>0. Dann 
ist die Beziehung 


Br 2 
IE Pr > REP REN EN, (6.10.1) 
mit 
P,(k) = P | EX = ı), (6.10.2) 
i=]1 
ee (6.10.3) 


genau dann gleichmäßig bezüglich k im Intervall —oo <k<oo erfüllt, wenn die 
größte Schriitweite der Verteilung der Variablen X, gleich Eins ist. 

Von einer Zufallsvariablen, die die letzte Bedingung erfüllt, sagen wir, daß 
sie die Bedingung (w) erfüllt. 

Ein Spezialfall ist der lokale Grenzwertsatz von MOIVRE-LArLAck für den Fall, 
daß die Zufallsvariable X, die Werte Eins bzw. Null mit den Wahrscheinlichkeiten 
pbzw.i1 —p annimmt. 


B. Beim Beweis des zuletzt erwähnten Satzes werden wir das folgende Lemma 
benutzen. 

Lemma. Wenn eine Zufallsvariable X nur ganze Werte annimmt und die Be- 
dingung (w) erfüllt, dann erfüllt ihre charakteristische Funktion p(t) die Bedingungen 


pr) =1, PWI<i1 für O<Itl<2n. (6.10.4) 
Beweis des Lemmas. Es ist 

= met 
mit % =P(X =k). Daraus ergibt sich 

yearn)= N met=- mt. 

k=—-o k=—c0 

Es seinun 0<|i,| <2r und off)! =1. Dann existiert ein « derart, daß 
ol) = ei ist: 


ji etwdF (x) = e®. 
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Wenn wir beide Seiten mit e”“ multiplizieren, erhalten wir 


few mar@) =1, 


00 
also 


ij cos (I,e — a)dF(a) = 5 Pr cos (u — a) =1. 


k=—00 


Diese Bedingung ist nur dann erfüllt, wenn für alle k die Gleichung cos (f,x, — @) 
= 1 gilt, also wenn 


2% 
=— +M—, Mg; ganz, 
t bo 


ist. Nach Voraussetzung sind die Zahlen x, ganz. Die Differenzen der Wertepaare 


2m 

der x; haben also die Form sh, wobei s eine beliebige ganze Zahl und h = I der 
bo 

größte gemeinsame Teiler der Differenzen der x; ist. Aus der Beziehung |t,| < 27 


folgt A > 1 im Widerspruch dazu, daß die Bedingung (w) erfüllt ist. Damit ist 
das Lemma bewiesen. 


C. Wir gehen nun zum Beweis des Satzes 6.10.1 über und zeigen zuerst, daß die 
Bedingung (w) hinreichend ist. 
Mit o(t) bzw. Pa (t) seien die charakteristischen Funktionen der Zufallsvariablen 


X, bzw. Y, = eK bezeichnet. Es ist 


i=1 


[ev] 
= 3 per, s 9.) = zu 5 Pt k)etk, 
k=—0 k=—00 
Auf Grund der Formel (4.5.7) erhalten wir 


z 


P,(k) = = put). e="t dt, 


und aus (6.10.3) folgt k = oYn2,, + mn. Es ergibt sich also 


6 


P,(k) = =) 2, (t) exp [-it(oYnzur + mn)| dt. 
3 


rn 
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Wenn wir u = ont setzen, finden wir 


a0 Yn 
1 u mn 
P.(k) = — „I — I exp | —iulz + —ı|de. 
2o/nr 1 x (2) | ( i )| 
20 Yr (6.10.5) 


In Beispiel 4.5.1 leiteten wir die Formel 
1 - - 1 zu 
en. ed -6.10.6) 


oo 


her. Wir werden nun zeigen, daß die Differenz 


R, = 2n 9 (ke) — Te en (- 2) 


im Intervall —oo <k<<oo gleichmäßig bezüglich k gegen Null konvergiert. 
Zu diesem Zweck benutzen wir die Formeln (6.10.5) und (6.10.6) und stellen Kt, 
als Summe von vier Integralen dar: 


zo Yn 


zen 
© 


2 
- [om (iu. 5) du=- I +1, +1+1] (6.10.7) 


oo 


< 2 
Jı = r exp (— ?U2,r) r (475) exp “ ) — exp ( 2)| du, 


lel<A 


Ts On = exp | — iu ME. du, 
oyr oYn 


Azlul<eo Yn 


Ss 


mit 


co Yrzlul<zo Yn 
2 
„,=- exp in) du; 


lulzA 
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dabei sind A und & positive Konstanten, über deren Wahl wir später sprechen 
werden. Jetzt wollen wir uns mit der Abschätzung dieser Integrale befassen. 


. a) Da nach Voraüssetzung der Zufallsvariablen X; eine endliche Dispersion 
haben, folgt aus dem Satz von LINDEBERG-LEVY (vgl. 6.8) und aus dem Satz 
6.6.1a, daß in einem beliebigen endlichen Intervall von u die Beziehung 


ICMEBIER 


gleichmäßig bezüglich u für n —0oo erfülit ist. Für ein beliebiges festes A strebt 
also I, gleichmäßig bezüglich 2,, für n —oo gegen Null. 


b) Aus der Voraussetzung über die Existenz des Moments zweiter Ordnung 
der Zufallsvariablen X; folgt die Existenz der zweiten Ableitung ihrer charakteri- 
stischen Funktionen. In Übereinstimmung mit der Formel (4.3.2) gilt in einer 
genügend kleinen Umgebung des Punktes i=0 die Beziehung 


F 021? 
log [e"to(t)] = log E ir + | 
Wenn also die Umgebung des Punktes ti = 0 hinreichend klein ist, erhalten wir 


; a ; 2,2 
log [e to ()] = — — + 0(), 


oe 


leimtolt)ise ®. 


Damit ist für ein genügend kleines & > 0 im Bereich |v| < co/n 


e o/n Pn — 
re) 


Daraus erhalten wir sofort eine Abschätzung des Integrals I;: 


u? 


Zeh, 


€ Yn x 
u? 


= u? 
ILI<2|e wel, * du =4Yali — ©(A)]. 
- 4A 


A 


Wenn wir also A genügend groß wählen, wird |/,| kleiner als eine beliebig vor- 
gegebene Zahl. 


c) Wir schätzen jetzt das Integral I, ab. Aus dem oben bewiesenen Lemma 
folgt, daß für 0 < |u| <2zoYn 


"ta 


<1 
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gilt. Also kann man zu jedem e>0 eine solche Zahl c>0 finden, daß für 
coYyn s|uw|s royn 


< er 


gilt. Daraus erhalten wir 


Inl<e® [ du<2nofne”. 


eo Yn=|ul<ze Vr 


Also konvergiert das Integral I, für n —co gleichmäßig bezüglich 2,, gegen Null, 
d) Die Abschätzung des Integrals I, erhalten wir sofort: 


ae] e "au = yintı- DO (A)]. 


Wenn wir also A hinreichend groß wählen, können wir |I,| kleiner als jede vor- 
gegebene Zahl machen. 

Wie wir sehen, konvergieren die Integrale I, und /, für 2 —coo gleichmäßig 
bezüglich 2,, gegen Null, und zwar unabhängig davon, wie die Werte A und e 
gewählt werden. Die Größen |I,| und |I,! können durch die Wahl eines genügend 
großen A und eines hinreichend kleinen e beliebig klein gemacht werden. Ihre 
Abschätzungen hängen dabei nicht von » ab. Daraus folgt, daß auch R, als 
Summe dieser Integrale für ein genügend großes beliebig klein gemacht werden 
kann. Es wurde also bewiesen, daß die Bedingungen dieses Satzes hinreichend 
sind. 

Wir wollen jetzt voraussetzen, daß die Bedingung (w) nicht erfüllt ist, daß 
also der gemeinsame Teiler h der Differenzen der Wertepaare, die die Zufallsvariable 
X; mit positiver Wahrscheinlichkeit annehmen kann, größer als Eins ist. Dann 
nehmen aber die Zufallsvariablen X, nur Werte’der Form 


2 =0a-+ kn k=0, +41, 42, ...) 


mit positiver Wahrscheinlichkeit an; die Menge der Werte, die von den Zufalls- 
variablen Y, mit positiver Wahrscheinlichkeit angenommen werden, besteht also 
aus Zahlen y, der Form 


y=na-kh (k=0, +1,42, ...). (6.10.8) 


Wir führen folgende Bezeichnung ein: 


u=na+|n +: (n =1,2,...) 


6.11. Die Gesetze der großen Zahlen von Poisson, TSCHEBYSCHEFF und CHintschn 257 


([A] bezeichnet die größte ganze Zahl nicht größer als A). Dabei kann ohne 
Beschränkung der Allgemeinheit « so gewählt werden, daß m — a =+0 gilt. 
Da’die Zahlen k, nicht von der Form (6.10.8) sind, bestehen die Gleichungen 


P,(k,) = 0 (n=1,2,...). (6.10.9) 


Aus den Definitionen der Zahlen z,, und. k, folgen die Ungleichungen 


Ial+1 


[Zn | = = oyr 


woraus sich die Beziehung 


1 Mk 1 
lim — exp —i= — 
n->00 Y2r 2 y2 E74 
ergibt. Aus der letzten Beziehung und der Formel (6.10.9) folgt, daß (6.10.1) 


nicht gleichmäßig bezüglich % gelten kann. Damit ist die Notwendigkeit der 
Bedingung (w) bewiesen. 


D. Es sollen nun die Zufallsvariablen X, nur Werte der Form . =a@a-+hk 
annehmen, wobei A > 0 der größte gemeinsame Teiler der Differenzen der 
Wertepaare x; ist. Die Zufallsvariablen 


X; —a 


Z = 
h 


nehmen nur ganze Werte an und erfüllen dann die Bedingung (w). Man kann 
also auf sie den bewiesenen lokalen Grenzwertsatz anwenden. 

Eine weitgehende Verallgemeinerung des Gnedenkoschen Satzes hat RıcHtER 
[1] angegeben, während M&JzL=R, PARASIUK und 'RwArscHzwA [1] sowie 
RicHTer [2] den lokalen Grenzwertsatz von GNEDENKoO auf mehrdimensionale 
Zufallsvariable verallgemeinerten. 


6.11. Die Gesetze der großen Zahlen von Poisson, Tschebyscheff und Chintschin 


A. In 6.3 leiteten wir das Bernoullische Gesetz der großen Zahlen her. Dieses 
Gesetz der großen Zahlen, historisch gesehen das erste, ist aber nur ein Spezialfall 
von allgemeineren Sätzen, die wir mit dem gemeinsamen \ Namen Gesetze der 
großen Zahlen bezeichnen wollen. 

Wir betrachten zunächst eine Folge von Zufallsvariablen {X,}, von denen wir 
nur voraussetzen, daß für. jedes % die Momente erster und zweiter: Ordnung 


BER) m, BI, — m] = 0} 


17 Fisz 
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existieren. Die Zufallsvariablen X, können abhängig oder unabhängig sein. 
Wegen der Ungleichung (3.3.1) erhalten wir für jedes k und jedes & > 0 


2 
PIX, -m|l2e2]<*. (6.1.1) 
& 


Wenn die Markoffsche Bedingung 
lim 0} = 0 (6.11.2) 


k->00 
erfüllt ist, erhalten wir aus (6.11.1) 


lim P[X, — m | 2 e]=0. 
k—oo 


Das ist der Satz von TSCHEBYSCHEFF. 


Satz 6.11.1. Es sei {X} eine beliebige Folge von Zufallsvariablen mit endlichen 
Dispersionen 0}. Wenn die Markoffsche Bedingung (6.11.2) erfüllt ist, konvergiert 
die Folge der Zufallsvariablen X, — mı stochastisch gegen Null. 

Wir nehmen jetzt an, daß die in diesem Satz betrachteten Zufallsvariablen 
X, paarweise unkorreliert sind, und bilden die Zufallsvariablen 


_ tt tie 


Ya (6.11.3) 
Rn 
Dann ist 
1 n 
EI)=-—- 3 m. 
ß N = b3 
Da die Zufallsvariablen X, paarweise unkorreliert sind, ist 
i n 
NT x-1 
Wenn also 
Rn 
2% 
im EI =-0 (6.114) : 
PR ! 


ist, folgt aus Satz 6.11.1 


im Pl, -EiJ)l2J=0. 


NR. 


Aus dem Tschebyscheffschen Satz erhielten wir also die Folgerung: 
Es sei {X,} (k = 1,2,...) eine Folge von paarweise unkorrelierten Zufallsvaria- 
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blen, für die die Größen E(X,) = m; und DM(X,) = ar:eXistiereni:Ist die Bei 
dingung (6.11.4) erfüllt, dann konvergiert die Folge von Zu Verrller 163 


Mm ++ m, 


n 


y. m=1,2,...) 


stochastisch gegen Null. 


Schema die Summe von n unabhängigen Zufalsvariablı 
betrachten, die eine Null-Eins-Verteilung mit P(X, =0) 


erfüllt. Die Folgerung aus dem Tschebyscheffschen Satz nü N 
Form an, die wir als Poissonsches Gesetz der großen Zahl, 


Satz 6.11.2. Wenn die Zufallsvariable Y,, das arithmehi 
variablen X, eines Poissonschen Versuchsschemas ist, 


tt t X 
N 


Y,= 


dann konvergiert die Folge 


In- pi +R++ a 


Rn 


stochastisch gegen Null. 


C. Wir betrachten jetzt den Fall, daß die paarweise unkotrelierten ZufaHs- 
variablen X, (k = 1,2, ...) denselben Mittelwert und dieselbe Standardabweichung 
haben. Für jedes % ist dann 


a0 =m, D(X,)=o. 


Wenn wir die durch die Formel (6.11.3) eingeführte Zuallseanäble x, benutzen, 
erhalten wir EN 
2 


E(Y,)=m, D!(Y, en 
n 
Es ist also 


lim D(Y,)=0, 


NO 


da 0? nach Voraussetzung endlich ist. Nach der Folgerung aus dem Tscheby- 
scheffschen Satz konvergiert die Folge {Y, — m} stochastisch, gegen Null. Wir 


Ei 
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haben damit das Tschebyscheffsche Gesetz der großen Zahlen (vgl. TscHEgy- 
SCHEFF [1]) erhalten, das wir folgendermaßen formulieren können: 

Satz 6.11.3. Ist die Zufallsvariable Y,, das arithmetische Mittel von n paarweise 
unkorrelierten Zufallsvariablen X,, die denselben Mittelwert und dieselbe Standard- 
abweichung haben, dann konvergiert die Folge {Y,„} stochastisch gegen den. gemein- 
samen Mittelwert m der Zufallsvariablen X. 

Wie der Leser bestätigen kann, ist das Bernoullische Gesetz der.großen Zahlen 
ein Spezialfall.des Tschebyscheffschen Gesetzes der großen Zahlen. 


D. Bei allen bisher betrachteten Gesetzen der großen Zahlen haben wir voraus- 
gesetzt, daß die Zufallsvariablen, deren stochastische Konvergenz untersucht 
wurde, eine endliche Dispersion besitzen. Wie CHINTscHin aber zeigte [1], isö die 
Existenz einer endlichen Standardabweichung der Zufallsvariablen X,, wenn sie 
alle dieselbe Verteilung haben, nicht notwendig dafür, daß die Folge {Y,} ihrer 
arithmetischen Mittel stochastisch gegen den gemeinsamen Mittelwert m der 
Zufallsvariablen X, konvergiert. 


Satz 6.11.4 (CuiwrscHm). Bs sei {X,)(k = 1, 2,.. ..) eine Folge von unabhängigen 
Zufallsvariablen mit derselben Verteilung und dem endlichen Mittelwert E I KM. 
Die Folge der Zufallsvariablen 


„AtbtH4 ia. 
R n 


konvergiert dann stochastisch gegen den festen Wert m. 


Beweis. Es sei (ft) die charakteristische Funktion der Zufallsvariablen X. 
Wegen der Unabhängigkeit der Zufallsvariablen X, hat die charakteristische 
Funktion der Zufallsvariablen Y,, die Gestalt 


KERo20.0ne 


Da der endliche Mittelwert m existiert, kann man die Funktion e(f) in der Um- 
gebung des Punktes t=0 nach der Maclaurinschen. Formel entwickeln: 


el) =1+ mit -+olt).. 3 .(6.11.6) 
Wir setzen den Ausdruck (6.11.6) in (6.11.5) ein und erhalten 


Pr 


Wenn wir ähnlich wie beim Beweis des Moivre-Laplaceschen Satzes vorgehen, er- 
halten wir 


‘ Im E Bl u ee (6.11.7) 
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Die rechte Seite dieser Formel ist die charakteristische Funktion einer Zufalls- 
variablen Y mit einer Einpunktverteilung, für die 


PY=m=1 


ist. N ach dem Satz 6.6.1b konvergiert die Folge‘ der Verteilungsfunktionen 
F„(y) der Zufallsvariablen Y, gegen die Verteilungsfunktion der Zufallsvariablen 
Y; die Folge {Y„} konvergiert also stochastisch gegen den festen Wert m. 


Der Satz 6.11.4 ist das O'hinischinsche Gesetz der großen Zahlen. - 


Beispiel 6.11.1. Kehren wir zum Beispiel 6.8.5 zurück. Wir zeigten dort, daß die cha- 
rakteristische Funktion 9(t) der Zufallsvariablen 


KH,tnt% 
Rn” ’ 
n 


wenn die Zufallsvariablen X, (k=1,2,..., n) unabhängig sind und dieselbe Cauchysche Ver- 
teilung haben, von der Form lt) = e” I. ist. 

Für die Folge {Y,} gilt also nicht das Gesetz der großen Zahlen. Dieses Ergebnis ist Bicht 
überraschend, da die Zufallsvariable X, keinen Mittelwert besitzt (vgl. Aufgabe 6.16.38). 


Die notwendigen und hinreichenden Bedingungen für die Gültigkeit des 
Gesetzes der großen Zahlen für eine Folge unabhängiger Zufallsvariabler haben 
KoLMOoGororrf [1] (vgl. Aufgabe 6.16.39) sowie FELLER [8] angegeben. 


6.12. . Das starke Gesetz der großen Zahlen 


A. Die bisher betrachteten Gesetze der großen Zahlen 3 engen, daß unter ge- 
wissen Bedingungen die Folge (Z,} der durch 


Zn 2; X — mit = a EX). (*) 
N = : n 

definierten Zufallsvariablen stochästisch gegen Null konvergiert. Dabei wurden 
die X, als unabhängig vorausgesetzt. Man kann also zu jedem e> 0 und „>0 
ein so großes N finden, daß P(|Z2,|>e)<n für nz N ist. Daraus folgt aber 
noch nicht, daß man für beliebiges e > 0 und 7 > 0 einsogroßes N wählen kann, 
daß die Relation 


P ea: |Z.| > ‘) <n (6.12.1) 

nzN 
gilt. Diese bedeutet nämlich, daß. die Wahrscheinlichkeit der Ungleichung 
IZ,„| > e für wenigstensen » (rn=N,N +1,...) kleiner als n ist; statt der 


Wahrscheinlichkeit eines Ereignisses (|Z,| > e) haben wir es hier mit der Wahr- 
scheinlichkeit der Summe von Ereignissen 


(l>JUlZrul>e)U (Zul >e)U-- 
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zutun. Man kann'zeigen, daß die Beziehung (6.12.1) mit der Beziehung 


P (Im Z,= 0) —1 (6.12.2) 


Nn—00 


‚letzte Beziehung besagt, daß die Folge (Z,} fast überall gegen 
i sse Äquivalenz beweisen wir am Ende von 6.12. 

Die bis jetzt achteten Gesetze der großen Zahlen nennen wir schwache 
Gesetze der großen allen. 


"Definition‘6.131. Wir sagen, daß für die Folge von Zufallsvariablen X, 
(k =1,2,...) das starke Gesetz der großen Zahlen gültig ist, wenn für die Folge 
ihrer arithmetischen Mittel Z, die Beziehung (6.12.1) für beliebiges e> 0 und 
n>d gilt. 


B:: Bisher‘ist;das'Problem der notwendigen und hinreichenden Bedingungen für 
die Gültigkeit des starken Gesetzes der großen Zahlen für eine Folge von un- 
abhängigen’ Züfallsvariablen noch nicht befriedigend gelöst worden. Ausführliche 
Informatioiien über den gegenwärtigen Stand der Forschung auf diesem Gebiet 
findet: man: inder:'Monögrafie von Lo&v& [1] und in der Arbeit von Caune [1]. 
Die ‚am. weitesten‘reichenden Ergebnisse wurden von PROCHOROW [1], [4] erzielt. 
Wir geben nachstehend.den Satz von KoLmocororr [2] wieder, der notwendige 
Bedingungen für die Gültigkeit des starken Gesetzes der großen Zahlen angibt. 
Der Beweis dieses Satzes beruht auf einer von KoLMmoGororr [1] bewiesenen 
Verallgemeinerung der Tschebyscheffschen Ungleichung, die wir nachstehend 
in.6.12.C. betrachten; In 6.12.D werden wir dann das Lemma von BOREL-CANTELLI 
(BOREL [1], CAnTELıi [1]) beweisen. Dieses Lemma werden wir dann beim Beweis . 
des nächsten Satzes von KOLMOGOROFF [7] verwenden, demzufolge für eine Folge 
von unabhängigen Zufallsvariablen mit derselben Verteilung die Existenz des 
Erwartungswertes eine notwendige und hinreichende Bedingung für die Gültigkeit 
des starken Gesetzes der großen Zahlen ist. 

'"Der Abschnitt 6.12!F ist den Fragen der Existenz notwendiger und hinreichen- 
der Bedingungen. für die Gültigkeit des starken Gesetzes der großen Zahlen in 
der Terminologie‘ ‘der Varianzen gewidmet. Die entsprechenden Ergebnisse sind 
dann in den Sätzen 6.12.4 und 6.12.5 formuliert. 


(. Die Kolmogoroffsche Ungleichung. Es seien X,, X,,...., X, unabhängige 
Zufallsvariable mit endlichen Dispersionen. Ferner sei 


N ae 
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. Dann besteht für jedes e>0 die Ungleichung 
P res BAR °) = 2 D:(Y,)-. (6.12.3), 
1<k<n &? 


Beweis. Wir bezeichnen mit A, das Ereignis, daß |Y,|<e für k=1,...,n 
ist, mit A, das Ereignis (}Y,| Ze) und mit 4,5 =2,..., n) das Ereignis, welches 
darin besteht, daß |Y,|<e fürk =1,2,....5 —1 und Ile > e ist. Wie wir 


bestätigen, ist das Ereignis ( max |Y,| > ‘) der Summe P> A, äquivalent, also 
1<k<n j=1 


isksn 


n 
ee 241 Pi ‘) -?($4)). 
je 
Da die Ereignisse A, einander paarweise ausschließen, ist (6.12.3) der Ungleichung 
n 1 e 
ZP(A)s—, D’%(Y,) (6.12.4) 
j=1 € 


äquivalent. Mit F„(y) bezeichnen wir die Verteilungsfunktion der Zufallsvariablen 
Y„. Dann gilt für. jedes y 


FRy)=-PY<y)=PY<yA)tH+PNM<y 4A) 
=P(4,)P(Y„<ylA) + "+P(A)P(Yn <y|An) 
= P(A,).F.(y|Ao) +++ P(4,) F,(y|An); 


wo F„(y|4;) die Verteilungsfunktion der bedingten Verteilung der Zufalls- 
variablen Y, unter der Bedingung A, ist. Da E(Y,) = 0 ist, erhalten wir daraus 


D(Y)= [yrar.l) = I P(A;) [yPar.(ylA) 
00 j=0 0x 


n n 


= EP(A)E(T}IA) 2 L P(A) E(EIA): (6.12.5) 


Wir erhalten weiter 


BIA)=EL(T +22 7, „U+ZUi+2 RD) AN] 


k>h>j 


>E 27 ;0:. +23 D40,) =): 


k>h>j 


In das Ereignis A, gehen nur die ersten j Zufallsvariablen U, ein. Da die Zufalls- 
variablen X, unabhängig sind, sind auch die Zufallsvariablen Y, und U, für 
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k>7j und die Zufallsvariablen U, und U, für k>h>j unabhängig. Daraus 
ergibt sich für j> 1 und für die betrachteten , kh>j 


E(Y,;,U,|4,)=0, E(U,U,|4,)=0. 

Wir erhalten also die Ungleichungen 
B(rRIA)SB(NA) G=12%...,n). 

Aus den Definitionen. des Ereignisses A, und der letzten Ungleichung folgt 
BirrA)2e (=12%...,n). 


Auf Grund der Formel (6.12.5) ergibt sich daraus 
D’Y)ZEPNP(A). 
at 


Wir haben die der Kolmogoroffschen Ungleichung äquivalente Formel (6.12.4) 
erhalten, womit die Kolmogoroffsche Ungleichung bewiesen ist. 

Die Kolmogoroffsche Ungleichung wurde (vgl. Aufgabe 6.16.41) von Häsek 
und R&nyı [1] sowie von BIRNBAUM und MARSHALL [1] verallgemeinert. 


Satz 6.12.1 (KoLMOGOROFF). Es sei {X,} eine Folge von unabhängigen Zufalls- 
variablen mit den Dispersionen D?(X,). Wenn die Ungleichung 
„er Anz (6.12.6) 
besteht, dann gilt für die Folge {X,! das starke Gesetz der großen Zahlen. Hierbei 
können wir 


ein 


n 
# (X) 
setzen. 
Beweis. Es sei 


=) Kr ei) 


k-1 n 
N und m, seien gewisse natürliche Zahlen, die durch die Ungleichung 
2m < N < mtl (6.12.7) 
miteinander verknüpft sind. Wir schreiben 


a: 1Z.1> ' 


nz2N 
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und zeigen, daß man für beliebiges &>0 und 7 >0 ein ee N wählen 
kann, daß Py <n ist. 
Es sei 


Am Fr max |Z,1> ‘). 


am <n<amti 
wobei m = m, eine natürliche Zahl ist. Es besteht die Ungleichung 
E Om: (6.12.8) 
M=Mo 


Wenn wir in der TRUE en D2(X,) durch »( =) er- 
setzen, erhalten wir 


gm+L 


mer( max |Z,| > ‚ < a 5 DHR,). 


ER 2: 
\lsnsart 2m? k=1 


Aus (6.12.8) ergibt sich also 


C) amtı 


Pr = & 2 DK). 


.e2 2am+2 


Wenn wir die Reihenfolge der Summation auf der teohten Seite der letzten Formel 
umkehren, erhalten wir 


1 . 
Pys-— 2 D:( Fr Bent (6.12.9) 
wobei die Zahlen m(k) die Beziehungen 
0 RE 
Amt; mit i<k<mtin, j—1,2,..) 
erfüllen. Es ist 
= 4 
5 1 2 1 < E3 
mm 22 Dim). 3k?’ 
also 
1 > D?(X,) 
Pr < — D(X,)+4 z 6.12.10 
er = > Een (6.12.10) 


Es seinun 7n>0 eine beliebige positive Zahl. Aus der Bedingung (6.12.6) und 
der Formel (6.12.7) folgt, daß für ein genügend großes N und damit auch für ein 
genügend großes my 
Sun ee) 
3 r-mtı 6? 2 


(6.12.11) 
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ist. Außerdem erhalten wir noch 


1a 
3er 2rmı 


2 D:(X,)s > D:(X,). 


< 2 


Auf Grund des bekannten Kroneckerschen Lemmas folgt aus (6.12.6) die Bezie- 
hung 


im — Dex) = 


M—>00 m; k=1 


Also ist für hinreichend große N 


A 
De(X 12. 
3er 22m. 2 = 2: nn 


Aus den Formeln (6.12.10) bis (6.12.12) erhalten wir 
Pr < N» 


Der Satz von KoLMOGOROFF ist damit bewiesen. 


Aus dem Satz 6.12.1 ergibt sich nachstehende Folgerung: Sind die Dispersionen 
einer Folge von unabhängigen Zufallsvariablen gleichmäßig beschränkt, dann gilt 
für diese Folge das starke Gesetz der großen Zahlen. Ist insbesondere X, die Anzahl 
der erfolgreichen Versuche (gleich 0 oder 1) im Versuchsschema von BERNOULLI, 
so gilt für die Folge {X,} das starke Gesetz der großen Zahlen, das in diesem Fall 
das Borelsche. Gesetz der großen Zahlen genannt wird. BOREL entdeckte diesen 
Satz im Jahre 1909 (Bokeu [1]). Desgleichen sieht man leicht, daß für die Anzahl 
der Erfolge im Versuchsschema von Poıssox das starke Gesetz der großen Zahlen 
ebenfalls erfüllt ist. 

DVvoRETz&kY [1] fand (vgl. Aufgabe 6.16.30) eine hinreichende Bedingung dafür, 
daß in einem Versuchsschema, in dem die Ereignisse in beliebiger Weise vonein- 
ander abhängig sind, das starke Gesetz der großen Zahlen gilt. 

Hinreichende Bedingungen für die Gültigkeit des starken Gesetzes der großen 
Zahlen in den Termini der Momente von höherer als zweiter Ordnung wurden von 
Brun& [1] und Prockorow [1], [4] angegeben. Bosrorr [1] fand notwendige 
(jedoch nicht hinreichende) und hinreichende (jedoch nicht notwendige) Bedin- 
gungen, wobei sich diese Bedingungen nur wenig voneinander unterscheiden. 


D. Nachstehend wollen wir das Lemma von BoREL-CANTELLI formulieren und 
beweisen. 

Lemma. Es sei {A,}(n = 1,2, ...) eine Folgezufälliger Ereignisse, und es möge 
P(A,) die Wahrscheinlichkeit des Ereignisses A, bedeuten, wobei 0 < P(A,)<1 
(n =1,2,...) ist. Dann gelten die folgenden Beziehungen: 


6.12. Das starke Gesetz der großen Zahlen 267 


I. Ist 


5 P(4,)<o, (6.12.13) 
n=1 


so treten mit der Wahrscheinlichkeit 1 nur endlich viele Ereignisse A, ein. 
II. Sind die Ereignisse A, (n=1,2,...) unabhängig und gili 


FP(A,) =, (6.12.14) 
n=i1 r 


so treten mit der Wahrscheinlichkeit 1 unendlich viele Ereignisse A, ein. 


Beweis. Es sei (6.12.13) erfüllt. Wir bezeichnen mit; A das zufällige Ereignis, 
das den Eintritt unendlich vieler Ereignisse A, bedeutet. Daraus folgt (vgl. Auf- 
gabe 1.8.7) 


© :00 
A=N UA. 
r=1ın=r 
Da für jedes natürliche r 
ACUM 
n=r 


gilt, ergibt sich hieraus (vgl. Aufgabe 1.8.10) 


Pu) <r( 04.) <YP(A,. | 
n=T n=r 
Aus (6.12.13) geht hervor, daß für ein hinreichend großes r die rechte Seite der 
letzten Ungleichung kleiner ist als eine beliebig vorgegebene Zahl e>0, und es 
ist somit P(A4) =0. Damit ist die erste Behauptung des Lemmas bewiesen. .. 
Nun seien die Ereignisse A, unabhängig, und es sei (6.12.14) erfüllt. Das Er- 
eignis A als Gegenstück zu A bestehe darin, daß nur endlich viele Ereignisse 
A, eintreten. Es ist somit _ 


Wegen der Unabhängigkeit der Ereignisse A, haben wir 


1- PiQ=P(A)=P(Ü nA) 


(1 P(A,)). (6.12.15) 


IA 
Me 
Ay 
er 
> 
Dr” 
| 
INSE: 
8 
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Die Beziehung (6.12.14) zieht nach sich, daß für jedes natürliche r das unendliche 
Produkt auf der rechten Seite von (6.12.15) Null ist, woraus P(4) =1 folgt. 
Damit ist auch der zweite Teil des Lemmas bewiesen. 

Für eine beliebige Folge {A,} zufälliger Ereignisse, d.h. ohne Voraussetzung 
der Unabhängigkeit dieser Ereignisse, hat Love [3], notwendige und hin- 
reichende Bedingungen (vgl. Aufgabe 6.16.34a) dafür gefunden, daß die Wahr- 
scheinlichkeit für das Eintreten unendlich vieler Ereignisse A, gleich 0 ist. 

. Nasu [1] fand notwendige und hinreichende Bedingungen (vgl. Aufgabe 6.16.34 b) 
.dafür, daß diese Wahrscheinlichkeit gleich 1 ist. 


Definition 6.12.2. Wir sagen, daß die Folgen zufälliger isn {X,} und 
{X} (k=1,2,...) äguivalent im Chintschinschen Sinne sind, wenn 


2 PAXLFX)<o 
k=1 


erfüllt ist. 


Satz 6.12.2. Es seien {X,} und {X} (k=1,2,...) zwei im Chinischinschen 
Sinne äquivalente Folgen zufälliger Ereignisse. Dahn gilt das starke Gesetz der großen 
Zahlen entweder für beide Folgen oder für keine von ihnen. 

Beweis. Es möge A, das Ereignis (X, X7) bedeuten. Aus der Definition 
6.12.2 und der ersten Behauptung des Lemmas von BOREL:CANTELLI geht hervor, 
daß gleichzeitig nur endlich viele Ereignisse A, auftreten können. Für jede Folge 
(x, x}) von Wertepaaren der Zufallsvariablen (X, X7) existiert somit ein k, der- 
art (für verschiedene Folgen von Wertepaaren (x,, xf) kann die Zahl k, verschie- 
den sein), dßx,;,=xa; für k>k, gilt. Da die Ausdrücke 


1 % 1% R 
— Yan — 3% 
N x-1 Rı- 


für n-> oo gegen O konvergieren, geht. aus der Definition 6.12.1 sofort hervor, 
daß das starke Gesetz der großen Zahlen für die eine der betrachteten Folgen 
{X} {X} dann und nur dann gilt, wenn es auch für die andere Folge erfüllt ist 
E. Für Zufallsvariable mit derselben Verteilung hat K.oLMosororr [7] den nach- 
stehenden Satz angegeben, den man das Kolmogoroffsche Gesetz der großen Zahlen 
nennt. 

Satz 6.123. Es sa {Y}(=1,2,...) eine Folge unabhängiger Zufalls- 
variabler mitder gleichen Verteilungsfunktion F (y). Eine notwendige und hinreichende 
Bedingung dafür, daß für eine gewisse Konstante ec _ 


P (im E IT: - | 0) =1 ’ (6.12.16) 
a>o | R i-ı 


gilt, ist die Existenz des Erwartungswertes E(Y) der Variablen Y mit der Verteilungs- 
funktion F(y), wobei c=K#{Y) ist. 
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Beweis. Esmöge E(Y) und damit auch Z{|Y!) existieren. Wir setzen dann 
X=Y-E(Y) sodaß E(X) =0 ist. Dann ist 


FPIXI>)=L FPR<IX|<k+N 6.12.17) 
i=1 ; del k=1 
= SEP(k<IXI<SE+NSEIR)<. 
k=1 


Wir betrachten die Folge der Zufallsvariablen Xf, die für © =1,2,... wie folgt 
‚definiert sind: 


y_$G für IX|<i, 
10 für IS] >i. 


Dabei ist X, = Y;, — E(Y). Aus (6.12.17) geht hervor, daß die Folgen {X;} und 
{X#} äquivalent im Chintschinschen Sinne sind. Um daher zu beweisen, daß für 
{X,} das starke Gesetz der großen Zahlen gilt, genügt es nach Satz 6.12.2 zu zeigen, 
daß dieses Gesetz für die Folge {X} erfüllt ist. 

Zu diesem Zweck zeigen wir, daß für die zus {X?} die Ungleichung (6.12.6) 
gilt. In der Tat, wir haben 


D2(X}) < E(X?) = f 2dF(x}) < Zu. +1PP(k<|X|<Ek +1), 


woraus 


21 1.1202 
Zelte“: 

ist 
Sa VEN Pik<|X|<k+1) 
i=1 v2 


Po<|xKs1yr2 Erra<ınısern 


„Pe<IXj=s a) 


+4 SPR<IXISk+N +2 2- : 
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Offenbar sind der erste, dritte und viert: Summand auf der rechten Seite der 
letzten Gleichung endlich. Nach Ungleichung (6.12.17) ist auch der zweite Sum- 
mand endlich ; somit ist die Ungleichung (6.12.6) erfüllt. Damit folgt aus dem Satz 
6.12.1, daß für die Folge {X} das starke Gesetz der großen Zahlen gilt, und das ist 
damit für die Folgen {X,} und {Y;} der Fall. 

Wir hatten gezeigt, daß die Existenz des Erwartungswertes E(Y) eine hin- 
reichende Bedingung für die Gültigkeit des starken Gesetzes der großen Zahlen 
für die Folge {Y;} ist. Es existiert somit eine Folge von Konstanten {c,} derart, daß 


no | R i=1 


P (1 % > Y;,— | =) =1 (6.12.18) 


ist. Wir müssen noch zeigen, daB „, = E(Y) gesetzt werden kann. Aus (6.12. 18) 
geht aber hervor, daß die Folge 


1: P3 Yımal 
N i-i 


stochastisch gegen 0 konvergiert. Da andererseits die Zufallsvariablen Y; allen 
- Voraussetzungen des Satzes 6.11.4 genügen, konvergiert auch die Folge 


1 Ba r-2H) 
N i=ı 


stochastisch gegen 0. Hieraus folgt 
limc, =E(Y). (6.12.19) 


Aus.den Beziehungen (6.12.18) und (6.12.19) folgt die Beziehung (6.12.16), in der 
ce=E(Y) ist. 

Nun nehmen wir an, daß für ein gewisses c die Gleichung (6.12.16) erfüllt ist. 
Wir setzen U;,= Y; — c. Die Gleichung (6.12.16) nimmt nunmehr die Form 


P (im, 2 U=0) —=1 
no N i-ı 
an, und wir erhalten 
(im v =) =T; 
d>00 ° 


Hieraus folgt wiederum, daß höchstens endlich viele Ereignisse (|U,| >) ein- 
treten können. Damit ergibt sich aber aus der zweiten Behauptung des Lemmas 
von BOREL-CANTELEI sofort die Ungleichung 


© m 
ZP(U|>N)<o. mr Dre (6.12.20) 


i=1 
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Wir bezeichnen mit U eine Variable mit der gleichen Verteilung wie U,. Unter 
Beachtung von (6.12.20) erhalten wir 


Buuy< Ik+ NP(R<|UI<SE+1) 
e=0 


— SEP(k<|UJSE+N +HI= FT PUUI >) +1 <o. 
k=0 Pen 


Es existiert also ein Erwartungswert E(U); damit existiert aber auch der Er- 
wartungswert E(Y). Wir können daher, wie oben gezeigt, c = E(Y) setzen. 

Damit ist der Satz bewiesen. 

Bei der Durchsicht des Beweises für die Beziehung (6.12.20) stellen wir fest, 
daß die Voraussetzung von der Gleichheit der Verteilung der Zufallsvariablen 
U, unwesentlich ist. Wir haben damit gezeigt: Wenn {U} ( =1,2,...) eine 
Folge unabhängiger Zufallsvariabler ist, für die das starke Gesetz der großen 
Zahlen für c„ = 0 gilt, ist die Ungleichung (6.12.20) erfüllt. 


F. Wir geben nun ohne Beweis den Satz von ProcHoRow [1] an, der not- 
wendige und hinreichende Bedingungen in der Terminologie der Varianzen 
für die Gültigkeit des starken Gesetzes der großen Zahlen für eine Folge beschränk- 
ter Zufallsvariabler X; formuliert, sofern diese der Bedingung 


I&|=o | - ) (6.12.21) 
log log i 
genügen. 
Für r=1,2,... setzen wir 


Pe 
H=L 5 mu. (6.12.22) 
2 art 


Satz 6.12.4 (Procuorow). Es sei {X} i =1,2,...) eine Folge unabhängiger 
Zufallsvariabler, die der Beziehung (6.12.21) genügen. Dann genügt die Folge {X,} 
genau dann dem starken Gesetz der großen Zahlen, wenn die Ungleichung 


2 exp (- ze) <o (6.12.23) 
- H T, 
für beliebiges e >0 get, wobei H, durch (6.12.22) definiert ist. 

Wie jedoch der nachstehende, von Fısz [6] bewiesene Satz (siehe auch ProcHo- 
row [5]) besagt, existieren für eine Folge unabhängiger Zufallsvariabler X, 
die beschränkt sind und einer schwächeren Bedingung als (6.12.21), nämlich der 
Bedingung 


I&1<t (6.12.24) 
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genügen, keine notwendigen und hinreichenden Bedingungen für die Gültigkeit 
des starken Gesetzes der großen Zahlen, sofern dieses Gesetz in Varianzen aus- 
gedrückt ist. 

Satz 6.12.5. Für eine Folge {X,) (ki =1,2,...) unabhängiger Variabler, die der 
Beziehung (6.12.24) genügen, existieren keine notwendigen und hinreichenden 
Bedingungen für die Gültigkeit des in Varianzen ausgedrückten starken Gesetzes der 
großen Zahlen. 

Dieser Satz läßt sieh auch noch wie folgt formulieren: Ist W (01, 02, ....) mit 

—.D2(X,) irgendeine hinreichende Bedingung für die Gültigkeit des starken 


“ Gesetzes der großen Zahlen für die Folge {X,;}, so existiert eine Folge unabhängiger 


Zufallsvariabler, die der Bedingung (6.12.24) genügen, für die das starke Gesetz der 

großen. Zahlen gilt und die dennoch die Bedingung W (07, 03, ...) nicht erfüllt. 
Beweis. Zum Beweis des Satzes genügt es, zu zeigen, daß zwei Folgen {X;} 

und {Y,} unabhängiger Zufallsvariabler existieren, die der Bedingung (6.12. 24) 


‘und der Gleichung 


D’&)-D(VY)=o 


genügen, wobei für die eine Folge das starke Gesetz der großen Zahlen gilt, für die 
andere hingegen nicht. 
Wir definieren die Zufallsvariablen X, und Y; wie folgt: 


Buster ee (6.12.25) 
log : log i 2: 

PRegsre 
ı 

Pr Zwerge (6.12.26 

(=Bi)=Pi PO = garni (6.12.26) 
41 s 

Pr ameten: 

i ) ’ ß? i logi. 


hierbei ist O<ß<1 und i=2,3,... Es ist dann 


D2(X,) = DAY) = —. 
log & Du 


Offenbar erfüllen die Zutsllsyäriahlan X, die Böriching (6. 12. 21). Wir zeigen, 
daß sie auch der Bedingung (6.12.23), genügen. In.der Tat, esist. . .ı... \. . 
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und für jedes & > 0 gilt somit 
Z exp (- =) <a zer =; < 


Aus dem Satz 6.12.4 geht hervor, daß für die Folge {X,} das starke Gesetz der 
großen Zahlen erfüllt ist. Für die Folge {Y;} gilt es hingegen nicht. In der Tat, 
In Gesetz sei für {Y;} bei einer beliebigen Folge {c,„} erfüllt. Dann ist es auch für 

=0(n=1,2, ...) erfüllt.!) Damit gilt aber auch die Beziehung 


io % 


P (I a = 0) =1. (6.12.27) 
Aus (6.12.26) folgt jedoch 


Erle 


und nach der zweiten Behauptung des Lemmas von BoREL-CANTELLI treten un- 
endlich viele der Ereignisse (|Y;| = ßt) ein, was der Beziehung (6.12.27) wider- 
spricht. Das starke Gesetz der großen Zahlen ist also für die nn {Y;} nicht er- 
füllt. 

Damit ist der Satz 6.12.5 bewiesen. 

Es sei darauf hingewiesen, daß man die Nichtexistenz von notwendigen und 
hinreichenden Bedingungen für die Gültigkeit des in Varianzen ausgedrückten 
starken Gesetzes der großen Zahlen für eine Folge von Zufallsvariablen, die keiner- 
lei Beschränkungen von der Art (6.12.24) genügen, auch aus den Beispielen hätte 
herleiten können, die KorLmoGororr [2] angegeben hat. Es läßt sich auch zeigen 
(Fısz [6]), daß in diesem allgemeinen Fall keine notwendigen und hinreichenden, 
in Momenten beliebiger endlicher Ordnung ausgedrückte Bedingungen existieren. 


6. Wir zeigen jetzt, daß die Beziehung (6.12.1) mit der Beziehung (6.12.2) äqui- 
valent ist, und bezeichnen dazu mit A, das Ereignis, das darin besteht, daß 


sup |Z,| > e ist (£>0), und mit A das Produkt der Ereignisse Ay: 
n2N 


A=]]Ax: (6.12.28) 
N 
Für jedes X ist 
Ayzı c Ay; 


!) Zu dieser Folgerung kann man auch über einen Satz gelangen, demzufolge für Zufalls- 
variable Y, von der Oranune O(i) und für eine Folge {Y,;}, für die das starke Gesetz der großen 


Zahlen silt, „= E I > Y; ) gesetzt werden kann. 


18 Fisz 
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also besteht nach Satz 1.3.4 die Beziehung 


P(4) =lim P(Ay). (6.12.29) 
Noo 


Das zu Ay komplementäre Ereignis Ay besteht darin, daß für jedes n> N 
die Beziehung |Z,| <= e besteht. Hier gilt für jedes N 


Ayyı D Ar: 
also besteht nach Satz 1.3.5 die Beziehung 


P(A)= P(z An) = lim P(Ay). (6.12.29”) 
No 
Die Beziehung (6.12.1) sei nicht erfüllt. Dann existieren derartige e>o0 
und 7 >0, daß für jedes N 


PAy)zn 
ist. Daraus und aus (6.12.29) erhalten wir die Ungleichung 
PA)zZn>0, i (6.12.30). 


aus der wiederum folgt, daß die Beziehung (6.12.2) nicht erfüllt ist. Aus (6.12.2) 
folgt nämlich: Die Wahrscheinlichkeit, daß für jedes N ein derartiges n= N 
existiert, für das ig: |>e ist, ist gleich Null; also wäre im Widerspruch zu 
(6.12.30) P(A) = 

Jetzt sei die ee (6.12.2) nicht erfüllt. Es gibt dann derartige e> 0 
und 7>0, für die die Wahrscheinlichkeit, daß für irgendein N das Ereignis 
Ay eintritt, kleiner als 1 — n ist, oder 


P(A)<i1-n. (6.12.31) 


Aus der letzten Ungleichung folgt, daß auch die Beziehung (6.12.1) nicht er- 
füllt ist, denn (6.12.1) besagt, daß es für beliebige e> 0 und 7>0 solche N 
gibt, für die P(Ay)Z1-—n ist. Wenn wir (6.12.29') berücksichtigen, würden 
wir P(A)>1-—n erhalten. Dies widerspricht aber der Ungleichung (6.12.31). 

Die Äquivalenz der Beziehungen (6.12.1) und (6.12.2) ist damit bewiesen. 


H. Zum Abschluß geben wir ein Beispiel für eine Folge von Zufallsvariablen, die 
stochastisch gegen 0 konvergiert, jedoch nicht fast überall gegen 0 konvergent 
ist (siehe auch Aufgabe 6.16.38). 


Beispiel 6.12.1. Wir betrachten die Folge {Z,} (n=1,2,...) unabhängiger Zufalls- 
variabler, wobei ” 


1 1 
PZu=0=- Er PZ,=0)=1— = (6.12.32) 


gilt. 
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Die Folge {Zu} konvergiert stochastisch gegen 0, denn aus der Gleichung P(]Z,| > e) 
= P(2,=1), die fürn=1,2,... bei beliebigem 0<e<1 gilt, erhalten wir für jedes 
e>o0 


1 
lim P(IZ,}>e)<lim — = 0. 
N—>0o NO N 


Die betrachtete Folge {Z,} erfüllt aber die Beziehung (6.12.2) nicht; denn bezeichnen wir 
mit A, das Ereignis (Z, = 1), so folgt aus (6.12.32) - 


5 P(A,)= =. 
n=1 


Aus der Unabhängigkeit der Ereignisse A, und aus dem Lemma von BOREL-CANTELLI geht 
hervor, daß die Wahrscheinlichkeit dafür, daß unendlich viele Ereignisse A, eintreten, 
gleich 1 ist. Die Wahrscheinlichkeit für die Existenz einer Teilfolge der Folge {Z,}, die nicht 
gegen 0 konvergiert, ist somit gleich 1. Dies widerspricht aber offenbar der Beziehung (6.12.2). 


6.13. Mehrdimensionale Grenzverteilungen 


Die Sätze 6.6.1a und 6.6.1b, verallgemeinert auf mehrdimensionale Verteilungen, 
spielen eine grundlegende Rolle in der Theorie der mehrdimensionalen Grenz- 
verteilungen. Wir werden diese Verallgemeinerungen nicht formulieren, da es 
genügt, in den erwähnten Sätzen die eindimensionalen charakteristischen Funk- 
tionen und Verteilungsfunktionen durch die entsprechenden mehrdimensionalen 
Funktionen zu ersetzen. 

Es sei jetzt (X,,...,X,) eine Zufallsvariable mit einer durch die Formel 
(5.12.1’) definierten Polynomialverteilung. Es ist also 


Ai pP epkrgnK, 


(6.13.1) 
wobei 
K=k+te+k, undg=1- 9 "—P 
ist. In 5.12 zeigten wir, daß die charakteristische Funktion 
Pl...) 
der Zufallsvariablen (X,, ..-, X,) die Form 
r > n j 
PYalld) = | Epjeti + ı) (6.13.2) 
j=1 


18* 
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hat, und bewiesen die Gleichungen 
E(X,)=np;, 
Ay; = D2(X,) = np, (l — P;) j=12,...,r), 
Ay = EUX, — np;) (X — nPpr)] 
= — NP; Pr (,k=12,..,r;j=#hk). (6.13.3) 
Wir betrachten jetzt die Zufallsvariable (Z,, ..., Z,); dabei ist 
j Fe Ko np; 
amt = m) 
Die Momente n;, zweiter Ordnung der Zufallsvariablen Z, sind durch die For- 
meln 


ml (G=1,...,r); 
_ / P; Pr 
tm) m) 


Velen): (6.13.4) 


Nie = Gk=l,..,r;j#k) (6.13.4°) 
gegeben. 

Der folgende Satz ist eine Verallgemeinerung des Moivre-Laplaceschen Satzes 
auf Polynomialverteilungen. 

Satz 6.18.1. Die Zufallsvariable (X, ..., X,) habe eine durch die Formel (6.13.1) 
gegebene Polynomialverteilung, und Fy(2, 2, -..,2,) sei die Verteilungsfunktion 
der durch die Formel (6.13.4) definierten Zufallsvariablen (Z,, ..-, Z,). It 0 <q<i 
undO <p; <1j=1,2,...,r), dann genügen die Glieder der Folge {Fy (21... - »2r)} 
der Beziehung 

lim F„ (21; -- - ; 2r) 
Nn>X 


21 Ar 


1 


ae [el Fl) da dr; 
el, 2|N | j=ı 
(22)? YIN|-» -% 


(6.13.5) 
dabei ist N die Momentenmatrix, deren Elemente die n;, sind, und 


N = —— +0, 
dp) p) 


ee (=1,2. 
1—-2).-(1- Pr) 


Tr), 


Nu md opt — m) GR=1,2,..,r:k+3). (6.18.,6). 


(1—- P)-(1—- Pr) 
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Beweis. Wir bezeichnen mit @,(t,, ...,t,) die charakteristische Funktion der 
Zufallsvariablen (Z,,...., Z,). Aus den Formeln (6.13.3) und (6.13.4) erhalten wir 


u it, Rn 

(E13 »..5 br) —=eX — sL; neh Zn en 
P.\ı e( e ; Ve == = (£re 2 == 2] 

log 9, (kı, BE 7 Eu id je 

Zn: 1-9; 


+nlog p, xp | — | +g 
2 1£ ni: kr - 2] | 
= —iyn B3 5; Pi 

;-1 1-9 


lee lı + I Fi, > i = 
Hi | ee, Se] 


= in I, 
; il 


+5). 


Dabei haben Sie mit s den Ausdruck 
E pP 1: he. 
one Mn (4 
Ynia 1i-p ZBnal-m .\n 


bezeichnet. Wenn wir berücksichtigen, daß |s| <1 für beliebige feste t,,....,& 
und genügend großes r ist, so können wir schreiben: 


lim |» log (1 + s) — iYn St; Re 
no 1 I = P 


pe f mm 
ee elle 
2 2 i Ze: 1- Pad m) 


Endgültig erhalten wir also 


PN: 1 r, P;Pr 
l tn.) = _ 7 — jo 
ke P: ( 1 ) or P) 129 a a — 9) - ä]) 


_(6.13.7) 
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Wir vergleichen (6.13.7) mit (5.11.9) und sehen, daß auf der rechten Seite von, 
(6. 13.7) die charakteristische Funktion der r-dimensionalen normalen Zufalls- 
variablen steht, deren Momentenmatrix durch die Gleichungen (6.13.4’) gegeben 
ist. Wenn wir endlich die Verallgemeinerung des Satzes 6.6.1b berücksichtigen, 
von der am Anfang dieses Paragraphen die Rede war, erhalten wir die Formel 
(6.13.5).1) Die Formeln (6.13.6) lassen sich leicht ausrechnen. 

In 5.12 zeigten wir, daß eine polynomial verteilte Zufallsvariable (X, ..., Xr); 
deren Verteilung durch die Formel (6.13.1) gegeben ist, als Summe von n un- 
abhängigen r-dimensionalen Zufallsvariablen mit gleicher Verteilung dargestellt 
werden kann. Von diesem Standpunkt aus kann man den Satz 6.13.1 als Grenz- 
wertsatz für eine Folge von Verteilungsfunktionen von Summen unabhängiger 
r-dimensionaler Zufallsvariabler mit gleichen Verteilungen betrachten. , 

In der Tat läßt sich der Lindeberg-Levysche Satz auf mehrdimensionale 
Zufallsvariable verallgemeinern. 

Wir wollen diesen Satz hier nur formulieren: 


Satz 6.13.2.. Es si (Yan Ima :---» Imr)} (m =1,2,3,...) eine Folge von 
unabhängigen r-dimensionalen Zufallsvektoren mit gleicher Verteilung und der 
Momentenmatrie M = (A) mit von Null verschiedener Determinante |M|. 
Weiter sei F„ (21, .-., 2r) die Verteilungsfunktion der Zufallsvariablen (Zyn --- » Zur)» 
wobei 


2 Y,— BY) 
Ze m m 
omsı Yn Ay; 


Die Glieder der Folge {F,(2,, ..- , 2,)} erfüllen dann die Beziehung - 


(=12,...,r). 


lim F„ (21: --- , 2r) 


n>0O 


- rei [e(-z Zee) dn..da,; 


(22)? Syım- 


dabei ist N = (n;x) die Momentenmatrix, deren Elemente n,, durch 
nl G=12%...,r, 


Ak 
N = 
ViysAr Ay 


(,k=1,2,..,r:j=#k) 


gegeben sind. 


1) Auch den Poissonschen Satz kann man auf die Polynomialverteilung verallgemeinern. 
Fısz [3] gab die Klasse aller möglichen Grenzverteilungen für die Polynomialverteilung 
an (vgl. Aufgabe 6.16.45). 
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Wir überlassen dem Leser die Durchführung dieses Beweises, der übrigens 
vollständig analog zum Beweis des Satzes 6.3.1 verläuft. 

Eine Verallgemeinerung des Satzes von LJAPUNOFF auf mehrdimensionale 
Verteilungen hat BERNSTEIN [3] angegeben. Den auf mehrdimensionale Verteilun- 
gen verallgemeinerten Satz von LINDEBERG-FELLER findet man in einer Arbeit 
von GNEDENKO [9]. MOURIER [1] hat eine weitreichende Verallgemeinerung des 
Satzes von LINDEBERG-L&vY für Zufallsvariable gegeben, die Werte in einem 
Hilbertraum durchlaufen. 


6.14. Grenzwertsätze für rationale Funktionen von Zufallsvariablen 


A. Wir bringen noch einige Sätze, die eine große Rolle in den Anwendungen 
spielen. 


Satz 6.14.1. Es sei {X} eine beliebige Folge von abhängigen oder unabhängigen 
Zufallsvariablen, und es konvergiere die entsprechende Folge der Verteilungsfunk- 
tionen F,„(x) fürn — oo gegen die Verteilungsfunktion F (x). 

Weiter sei {Y„} eine beliebige andere Folge von Zufallsvariablen, die stochastisch 
gegen die Konstante a konvergiert. Dann konvergiert die Folge der Verteilungsfunk- 
tionen 


&) der Zufallsvariablen X„+ Y„ gegen die Verteilungsfunktion F(xz — a), 
ß) der Zufallsvariablen X, — Y„ gegen die Verteilungsfunktion F(x + a), 


y) der Zufallsvariablen X, Y, gegen die Verteilungsfunktion F (2) ‚falls a >-0, 
a 
und gegen.die Verteilungsfunktion 1 — F (2) ‚fells «<O ist, 
a 


6) der Zufallsvariablen = gegen die Verteilungsfunktion F(ax), falls a > 0, 


und gegen die Verteilungsfunktion 1 — F(ax), falls a <O ist. 


Wir beschränken uns auf den Beweis der Behauptung y) für «>0, da die 
Beweise der übrigen Behauptungen analog sind. 
Mit ®,(x) bezeichnen wir die Verteilungsfunktion des Produkts X,Y,. Es 


sei ” eine Stetigkeitsstelle der Grenzverteilungsfunktion F(x). Wir haben die 
” 


Beziehung 


Ö,(8) =P(X,Y„<x)>F (2) (6.141) 


zu beweisen. Mit $ bezeichnen wir die Menge aller Punkte in der Ebene, für die 
die Ungleichung 2,4, < x erfüllt ist. Man kann S auch als Vereinigung von zwei 
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punktfremden Mengen 8, und 8, darstellen, denen die Punkte angehören, die die 
Ungleichungen 


nYn <a, |m—alse (6.14.2) 

bzw. 
LuYn <E Imn-el>e (6.14.3) 

erfüllen, wobei 0 <e <a ist. Wir bezeichnen weiter mit A bzw. B diejenigen 

Mengen in der &,, Y„-Ebene, die durch die Ungleichungen 

la —E)<X, |mM-else (6.14.4) 


bzw. 
ma +9)<z, Im-alze (6.14.5) 


definiert sind. 

In Abb. 6.14.1 (sie stellt nur die Halbebene y,> 0 dar) liegt die Menge 8 
außerhalb der Hyperbel #,y, = x. Die Menge 8, wurde schraffiert, die Menge 
A— 5, mit dem Symbol J und dieMenge 8, — B mit dem Symbol IT bezeichnet. 


Se 


s ee 
N 


Abb. 6.14.1 


0 A 


Wir bezeichnen mit P, (8), Pa (81); Pn (8a), Pn(A) und P„(B) dieentsprechenden 
Wahrscheinlichkeiten dafür, daß die zweidimensionale Zufallsvariable (X,, Y,) 
Werte aus diesen Mengen annimmt. 

Es ist 


D.(8) = PX, Y,< %) = P,(8) = P.(8}) + Pa). (6.14.6) 
Wegen B cIH,cA is 
P.(B) = P,(8) s Pı(4). (6.14.7) 
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Wir bemerken weiter, daß 
x x 
F, = PIX,„< 
a-+e a+te 


B4 x 
Pin. <. Masdtrin< in Ir.-al> 


a-+e 


7) a rn < IYra el > 
a—E£ a —E 


ist. Unter Berücksichtigung der Formeln (6.14.6) und (6.14.7) erhalten wir 
daraus die Ungleichung 


r.( 2 )- Pe < I—al>l 
a+e a+e 


<®,(@)— Pu) SF, P = ) - Pin < | >. 


a 
a—e 
Es ist 


Pu < Ir-al> | <Pir.—al> a), 
a-+eE 
Pı(8) = PR, In <, .-al>gsPilY„—al>e}, 
Pin<—. N-al>dspin-al>e 
a —E 


Aus der Voraussetzung über die stochastische Konvergenz der Folge {Y,} 
gegen die Konstante « folgt, daß für n —oo die Wahrscheinlichkeiten auf der 
rechten Seite dieser Ungleichungen gegen Null streben. Wir erhalten also aus 
(6.14.8) . ; 


r( = ) = mr (I) Sim oe im Fr ( = )=?( a2 ) 
a-+e n->00 are Nn—>00 n—0 a—E a—E 


x 


und Stetigkeitsstellen der Verteilungsfunktion F (x) sind. 


& a—e 
 Beachtet man darüber hinaus, daß man e beliebig klein wählen kann, so ergibt 
sich sofort (6.14.1). 


wobei 
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Der hier gegebene Beweis des Satzes 6.14.1 geht auf Cram&e [2] zurück. Einen 
anderen Beweis für die Behauptung «) gab N#zyMAn [8] (siehe auch WoLrowıtz 
[1]). Einen einfachen Beweis aller Teile des Satzes 6.14.1 erhält man auch unter 
Verwendung des Satzes 6.4.1 (siehe SYERDEUP [1)). 

Eine Verallgemeinerung der Behauptung «&) des Satzes 6.14.1 für den Fall, 
daß die Folge der Verteilungsfunktionen der Zufallsvariablen Y, gegen die Ver- 
teilungsfunktion einer nichtausgearteten Zufallsvariablen konvergiert, stammt 
von TEICHER [1]. 


B. Eine Folgerung aus diesem Satz ist der Satz von SLutskı [1]: 
Satz 6.14.2. Wenn die Folgen {Xjxh ..., {X,.} von Zufallsvariablen, wobei r 


eine bestimmteZahl und k = 1,2, ... ist, stochastisch gegen.die festen Werte a, ..., & 
konvergieren, dann strebt jede rationale Funktion R(X jr -.-, X) slochastisch 
gegen den festen Wert R(a,, ..., a,), wenn dieser Wert endlich ist. 


Für den Beweis genügt es, in Satz 6.14.1 für F(x) die Verteilungsfunktion der 
Einpunktverteilung zu nehmen und zu bemerken, daß dieser Satz richtig bleibt 
für eine Folge von Zufallsvariablen, die man erhält, indem man endlich viele 
rationale Operationen an den Zufallsvariablen ausführt. 


€. Als einfache Folgerung von Satz 6.14.1 erhalten wir folgende Verallgemeinerung 
von Satz 6.2.1. 


Satz 6.14.3. Es sei {Z,} (n=1,2,3,...) eine Folge von Zufallsvariablen, die 
stochastisch gegen die Zufallsvariable Z, konvergiert. Es besteht dann die Relation 


lim F,(z) = F,(e) (6.14.9) 


2>00 


an jeder Stetigkeitsstelle der Verteilungsfunktion F,(z), wobei F(z) bzw. F,(z) die 


. Verteilungsfunktionen der Zufallsvariablen Z, bzw. Z, sind. 


Beweis. Es sei die Voraussetzung des Satzes erfüllt. Wir schreiben 
Zu = Zt (Zu — ZZ): 


Da die Folge {Z, — Z,} stochastisch gegen Null konvergiert, folgt die Formel! 
(6.14.9) sofort aus der Behauptung «) des Satzes 6.14.1. 
Es sei darauf hingewiesen, daß die Umkehrung dieses Satzes nicht gilt. Be- 


"kanntlich (siehe Satz 6.2.1) läßt sich dieser Satz in dem speziellen Fall umkehren, 


wenn Z, mit der Wahrscheinlichkeit 1 einen konstanten Wert annimmt. 


6.15. Schlußbemerkungen 


In den letzten Jahren erschienen Arbeiten, in denen Grenzverteilungen von 
Summen unabhängiger Zufallsvariabler behandelt werden, bei denen die Anzahl 
der Summanden eine Zufallsvariable ist. Es sei daran erinnert, daß wir in 5.14 
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eine Zufallsvariable Y betrachtet hatten, die durch die Formel 


N 
=} X, 
k=1 

definiert ist, wobei nicht nur X,, sondern auch N eine Zufallsvariable ist. Die 
Verteilung der Variablen N möge vom Parameter t abhängen. Dann ergibt sich 
das Problem, die Grenzverteilung der Zufallsvariablen Y (geeignet normiert) für 
den Fall zu bestimmen, daß #—oo geht. Wir begnügen uns hier damit, einige 
der wichtigsten Arbeiten auf diesem Gebiet zu nennen, und zwar die Arbeiten 
von Rossens [1], DoBruscHhin [4] und Auscomse [1]. Diese Arbeiten haben 
praktische Anwendungen gefunden (siehe z.B. Rünyı [7] und Taxics [5)). 
Auf eine ähnliche Problematik werden wir in Kapitel 17 stoßen (vgl. auch die 
Aufgaben 6.16.46 und 6.16.47). 


6.16. Aufgaben und Ergänzungen 


1. Die Zufallsvariablen X und Y seien unabhängig, und es habe X die Poissonsche Verteilung 
mit dem Parameter 4 =1. 


a) Man bestimme unter Verwendung von (6.5.6) die Verteilungsfunktion der Zufalls- 


i 
variablen Z= X -+ Y, wobei Y der Binomialverteilung mit n=5 und? = 5 genügt. 


b) Man bestimme unter Verwendung von (6.5.9) die Verteilungsfunktion des Quotienten 
X 
2= y wobei Y eine Zufallsvariable mit der Normalverteilung N (0; 1) ist. 
2. Man beweise den nachstehenden Satz von Heıry: Konvergiert die Folge der Verteilungs- 


funktionen F,(«) (n=1,2,...) gegen die Verteilungsfunktion F(x) und ist g(x) eine 
auf der ganzen x-Achse stetige und beschränkte Funktion, so ist 


lim f gie) dF,„(e) = f ge) dF(e). 


Hinweis. Der Beweis ist dem Beweis des Satzes 6.6.1a ähnlich. 


3. Man gebe ein Beispiel für eine Folge von Verteilungsfunktionen F,(x) von Zufalls- 
variablen X, mit den Varianzen D?(X,,), für die die Beziehung 


gilt, die Beziehung 
lim D(X,)=1 


N->X 


hingegen nicht erfüllt ist. 
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Hinweis. Man betrachte zunächst die Folge der Zufallsvariablen Y „, für die 
1 1 
PY,=)=-1-—, PY,=n=— n=1,2,3,...) 
n n 


gilt, und verwende dann die Behauptung «) des Satzes 6.14.1. 


4. Man beweise die folgende Behauptung: Soll eine Folge von Verteilungsfunktionen F, (x) 
gegen die Verteilungsfunktion F (x) konvergieren, so ist notwendig und hinreichend, daß 
die Beziehung 


lim F„(z) = F(«) 


Nn>X 


in einer gewissen Menge $ erfüllt ist, die auf der ganzen x-Achse überall dicht ist. 


5. Es möge die Folge der charakteristischen Funktionen p,(f) gegen die charakteristische 
Funktion p(t), die Punktfolge {f,} gegen i, konvergieren. Man zeige, daß p, (t,) > p{i,) gilt. 


6. Man sagt, die Verteilungsfunktionen F(x) und @(x) seien vom gleichen Typ, wenn Kon- 
stanten «> 0 und b derart existieren, daß die Gleichung 


G(&) = F (ax -- b) 


erfüllt ist. Die Folge der Verteilungsfunktionen F„(x) möge für n—oo gegen die nicht 
ausgeartete Verteilungsfunktion F(x) konvergieren. Ferner möge die Folge der Ver- 
teilungsfunktionen F,(a„® + b,) gegen eine nicht ausgeartete Verteilungsfunktion 
G (x) konvergieren. Man zeige, daß dann @(x) vom gleichen Typ ist wie F (x) (CHINTScHIN 
[8)). WR 

Hinweis. Man beschränke sich auf Teilfolgen {a,,} und {b„,}, die gegen die (endlichen 
oder unendlichen) Zahlen & bzw. b konvergieren. Sodann zeige man, daB 0 <a< oo 
und —o<b<ounddaß F, a, +5)>Flaxr-+b) gilt. 

(Eine Verallgemeinerung des hier verwendeten Begriffs ‚Typ‘ sowie des oben angegebenen 
Satzes für n-dimensionale Zufallsvektoren stammt von Fısz [2].) 


7. Man beweise die Beziehung (6.4.6). 
Hinweis. Der Rand der Menge 8 ist Fr(8$)—= Sn R — 8; die Menge der inneren Punkte 
| von 8 ist Int($) = 8 — Fr($). Man verwende die Gleichung P„[Int($)] + P,[Int(R — 8)] 
+ P,[FrS)J=1(n=1,2,...) und zeige zuerst, daß aus (6.4.1) sowie aus der Glei- 
chung P[Fr($)] = 0 die Beziehungen lim P,[Int(8)] = P[Int ($)], lim P„[Int(R — $}| 
N>X Nn>X 
= P[Int(R — 8)] und lim P,[Fr(8)] = P[Fr($)] folgen. 
NO 
8. (Umkehrung des Satzes von LinDEBErg-Le£vy). Es sei {X,} (k= 1,2, 3,...) eine Folge 
unabhängiger Zufallsvariabler mit gleicher Verteilung. Ferner möge für gewisse Kon- 
stanten a und A, (r = 1,2,3, ...) die Beziehung 


e 1 2 1 22 
lim P[—. X, — A„<z)= — expf—- —|dz 
no ayn »=1 V2r 2 
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10. 


11. 


12, 


13. 


. a) Die Zufallsvariablen X; = 1,2,...,r) seien unabhängig, und es mögen die X, der 


für jedes z gelten. Man zeige, daß die Varianz, o? der Zufallsvariablen X, existiert. Es 


gilt dann «= oo, und für A, läßt sich die Größe — N EIX „) verwenden (vgl. GNEDENKO 
und Kormogorov [1], $ 35). g 


Poissonschen Verteilung mit dem Parameter A, > 0 genügen. Man zeige, daß x, 
i-1 
rT Tr 
für A) ++ 4, > 00 die asymptotische Normalverteilung N | 3/4; |/ DA; hat. 
ie i=1 
b) Die Zufallsvariablen X, bzw. X, mögen eine Poissonsche Verteilung mit den Para- 
metern 4,>0 bzw. 4,> 0 haben. Man zeige, daß für lim (A,/A,) = 1 die Zufalls- 


variable en 
= 2 x 


für ein beliebiges p > 0 für A, —oo und A, —o0 die asymptotische Normalverteilung 


| y—h 1 ) 
(Ay + A)P’ (A, + A,)p=05 
besitzt. 


Die Zufallsvariablen X,, X, und X mögen die gleiche nicht ausgeartete Verteilung mit 
der endlichen Varianz 0? besitzen, und es seien X, und X, unabhängig. Gilt dann für ein 
gewisses a > 0 die Gleichung 


X, +X,=al, 


so haben X,, X, und X die Normalverteilung N (0; o), und esist a = y? (PöryA [2]). 


Hinweis. Nach Verifizierung der Tatsache, daß a = y? ist und die charakteristische 
Funktion (t) der Zufallsvariablen X für jedes natürliche k der Gleichung 


9" (17 YzR) = pt) 


genügt, wende man den Satz von Linperere-Lüivy an. 
(Eine Verallgemeinerung für mehrdimensionale Zufallsvariable und Zufallsvektoren in 
einem Hilbertraum haben ProcHorow und Fısz [1] angegeben.) 


Man zeige, daß unter’ den Voraussetzungen des Satzes 6.9.1 auch die Bedingung (6.9.20) 
erfüllt ist. 


Es sei {X,} (k= 1,2, ....) eine Folge unabhängiger Zufallsvariabler, und es sei 
Pa 1: 3-k 
P(X 2k) — P(X 2t) = a 
E 5 Dr 


Man überprüfe, ob für diese Folge die Bedingung (6.9.20) erfüllt ist. 
a) Man überprüfe, ob für die Folgen {X,;} und {Y,} unabhängiger Zufallsvariabler, deren 
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14. 


15. 


16. 


17. 


18. 


19. 


Wahrscheinlichkeitsfunktionen durch die Formeln (6.12.25) und (6.12.26) gegeben 
sind, die Bedingung (6.9.20) erfüllt ist. 


b) Man löse die gleiche Aufgabe für den Fall, daß PX, = —k)= P(X, = KM = - 
für «> 0 gilt. 
Die Zufallsvariablen X, (k = 1,2, ....) seien unabhängig und mögen die Normalverteilung 
E . 
N (o; 2 2) besitzen. Man überprüfe, ob für diese Folge a) der zentrale Grenzwertsatz 
gilt, b) die Bedingung (6.9.20) erfüllt ist, c) die Beziehung lim max (0,/C,)=0 gilt. 
n>Xx 1Sk£n 

Wir betrachten die Folge unabhängiger Zufallsvariabler X, (k = 0,1, 2,...), wobei X, 
die durch (5.8.6) definierte Gammaverteilung hat, während die X, (k=1,2,...) die 
gleichen Verteilungen haben wie in der vorhergehenden Aufgabe. Gilt für die Folge 
{X} (k= 0,1, 2, ...) der zentrale Grenzwertsatz? 


Die Zufallsvariablen X, (k = 1,2, ...) seien unabhängig und mögen die Poissonsche Ver- 
teilung mit dem Parameter A, = 2”F besitzen. Man stelle fest, ob für die Folge {X} der 
zentrale Grenzwertsatz gilt. 


kn ö 
Es sei Y„= I X,+ (vgl. 6.9.0), wobei die Zufallsvariablen X,, (k=1,2,...,%,) für 
kei 


jedes n unabhängig sind und die durch die Formeln P (X, = Lak) = Pal gegebenenWahr- 
r 
scheinlichkeitsfunktionen haben; dabei sei > Puz=im=12,..;k=1,2,..., ku; 
i=1 
t=1,2,...,r;r> 2). Wir nehmen an, daß 


a) die X, asymptotisch konstant sind, d. h., daß für jedes e> 0 
lim max P(lXyk — Marl > e) = 0 
n>X 1ISkSin 
gilt, wobei m,;, der Mittelwert der Variablen X,. ist; 


b)lim max ,g=lm min u = (l=1,...,r) Mit Zu = Lori — Eneı gt. 
n—>X ISkSkn n>X 1<ksien 

Man bestimme die Klassen der möglichen Grenzverteilungsfunktionen der Folge der 

Verteilungsfunktionen F„(y) der Zufallsvariablen Y,— A, für beliebige Konstanten- 

folgen {A„} (Kusık [1]). 


Wir bezeichnen mit m?) das Moment der Ordnung %k der Zufallsvariablen X, mit der 


Verteilungsfunktion F,„(z). Für k=1,2,... mögen die endlichen Grenzwerte 
my, = lim m{®) existieren, und diese Grenzwerte mögen darüber hinaus (vgl. Aufgabe 4.8.10) 
Nn->00 


eine gewisse Verteilungsfunktion F(x) eindeutig bestimmen. Man zeige, daß dann die 
Folge {F„(x)} gegen F(x) konvergiert. (Das ist der zweite zentrale Grenzwerisatz; vgl. 
FRECHET und SHonar [1].) 


Die Zufallsvariablen X,, X,, X, ... mögen allen Bedingungen des Satzes von LINDEBERG- 
L&ävy genügen, und es möge darüber hinaus Z (| X, |?) existieren. Dann gilt die Beziehung 


IF) - 5 Ze 


= 3 Th 
() Yn 


wobei c eine Konstante ist (CRAm&r [1], Esseen [1], BeRRx [1]). 
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20. Die Zufallsvariablen X, (# = 1,2,...) seien unabhängig und mögen die gleiche durch die 
Formeln 


PX, =0)=P(X,=3)=-P(X,=N=- PX, =) = 
gegebene Verteilung besitzen. Man stelle fest, ob für die Folge {X;} der lokale Grenzwert- 
satz von GNEDENKO gilt. 


21. Die Zufallsvariable X möge eine Poissonsche Verteilung mit dem Parameter A haben. 
Ferner si, =P(X=r)(r=0,1,2,...),t= (r —A)] 2 und 


u, = 


N R 
w. [i 2 rn 
= 2yr sy) 


Des weiteren gelte A—oo und r—oo in der Weise, daß t absolut beschränkt ist; man 
zeige unter Anwendung der Stirlingschen Formel, daß für jedes e> 0 


lim (A=*(u, — 2,)) = 0, 


4->09 


3 
lim (r a — =) =0 


a} 


gilt. 


22. Die Zufallsvariablen X, (= 1, 2,...) mögen allen Bedingungen des Satzes 6.10.1 und der 
Bedingung (w) genügen und das Moment der Ordnung v > 3 besitzen. Dann gilt (mit 
den Bezeichnungen von 6.10) für n—oo die asymptotische Formel 


Pn(k) = —= 7 [r® + I are, (#0) + o(n-e-DR), 


2 yr r=1 


1 2 
wobei 2 = 24% Pl?) = — exp | — = ist und die Funktionen U, für jedes r sich 
Y2r 2 


durch Koeffizientenvergleich bei den aufeinanderfolgenden Potenzen von 1/ Yn in der 
Identität 


Kr r _r RER = —r 
exp (- re ») +3 uf pe)" 


bestimmen lassen, in der x,+, die Semiinvariante der Ordnung r + 2 der Zufallsvaria- 
blen X,/e ist (Esserx [1)). 
a) Man drücke (-P(a))e+2 mit Hilfe Hermitescher Polynome aus. 
b) Man berechne den Ausdruck P,„(k) für v = 4. 
23. Die unabhängigen Zufallsvariablen X, (i = 1,2) mögen eine Poissonsche Verteilung mit 


den Parametern A, > 0 bzw. }, > 0 haben..Dabei sei A; = d;n, wobei d, und d, positive 
Konstanten sind. 
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a) Man beweise: Ist A, —o0 (= 1,2), so gilt für eine beliebige ganze Zahl v>1 die 
le Formel 


PX, —-X,=h = 


Po + ZT, (#0) toll + A)murDR), 


Zi 
es: 129 ai 


| k— (A A 
| . „wobei 2= eh) ist und u,(-p@) ebenso bestimmt wird wie in Auf- 
VA + A 
gabe 22, und zwar mit 
nl2(A, + Ay)? für r=234,..., 
a Tara, — Al + A,)- (ra für r=1,3,... 


b) Unter Verwendung der Aufgabe 5.14.5b ermittle man die asymptotische Formel für 
die Besselsche Funktion /,(24) mit rein imaginärem Argument. 


24. Unter Verwendung des in Aufgabe 22 angegebenen Ergebnisses von Essen bestimme 
man für w, eine genauere asymptotische Formel als die in Aufgabe 21 hergeleitete. 


25. Die Zufallsvariablen X, X... seien unabhängig und mögen die gleiche Verteilung mit 
der durch die Formel 


f) für |2]|2 —, 


1 
een fü = 
2] log? |e| iz 


definierten Dichtefunktion f(x) besitzen. Man zeige, daß der integrale Grenzwertsatz von 
LiNDEBERG-L£vy für die Folge {X} erfüllt ist, während die Folge der Dichtefunktionen 
der Zufallsvariablen (X, + "+ X,)/o Yn nicht gegen die Dichtefunktion der Normal- 
verteilung konvergiert (GNEDENKO und KoLMocorov [1]). 


26. Es sei {X} = 1,2,...) eine Folge unabhängiger Zufallsvariabler mit gleicher Dichte- 
funktion f(x), und es sei /„(x) die Dichte der Zufallsvariablen 


DE REIN 
2, - Ha Ha. 
Rn 


Sollen dann die Konstantenfolgen {4,} und {B,„} existieren, für die die Beziehung 


lim sup | /„(&) — Me = _ En 2)l—=0 (*) 


gilt, so ist notwendig und hinreichend, daß die folgenden Bedingungen erfüllt sind: 
1. Die Folge der Verteilungsfunktionen F,„(x) der Variablen Z, konvergiert gegen ® (x); 


2. es existiert ein m derart, daß die Verteilungsfunktion der Summe X, + 2, + -+ X 
absolut stetig ist und eine beschränkte Ableitung besitzt (GNEDENKOo [2], [3]). 


a) Man stelle fest, ob für eine Folge unabhängiger Zufallsvariabler X, mit der gleichen 
Rechtecksverteilung im Intervall [0, 1] die Beziehung (*) gilt. 
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27. 


28. 


29. 


30. 


19 Fisz 


b) Man löse die gleiche Aufgabe für den Fall, daß die X, eine Gammaverteilung haben. 
c) Man löse die gleiche Aufgabe für den Fall, daß die X; eine Betaverteilung haben. 


Man beweise, daß der Satz 6.11.3 gültig bleibt, wenn 
&) die Voraussetzung von der Gleichheit der Varianz durch die Annahme ersetzt wird, 
daß die Varianzen gleichmäßig beschränkt sind; 


b) die Voraussetzung, daß die Zufallsvariablen X, paarweise nicht korreliert sind, durch 
die Annahme ersetzt wird, daß die Kovarianzen der Paare (X, X,,} für |k, — ig] > 
gleichmäßig gegen Null konvergieren. 


Die Zufallsvariablen X,, X,, X, ... und X seien gleichmäßig beschränkt. Man zeige, daß 
die Folge {X,} dann und nur dann stochastisch gegen Null konvergiert, wenn . 


lim E(X,— X) =0 

N>X 
gilt. 
Hinweis. Man verwende die Tschebyscheffsche Ungleichung und die Kolmogoroffsche 
Ungleichung aus Aufgabe 3.9.8. 


Es sei {A,} (k=1,2,...) eine Folge zufälliger (abhängiger oder unabhängiger) Er- 
eignisse. Wir betrachten die Folge der Zufallsvariablen Y, mit P(Y,=1!) = P(A,), 
P(Y,=0) =1— P(4,). Dabei setzen wir 


2 
Pıln)= —— 2, Pi4AN. 


n(n — 1) 1<5%<n 
d, = Pz(n) — pin). 


Man zeige, daß die Folge {X,} dann und nur dann stochastisch gegen Null konvergiert, 


wenn limd, = 0 ist. Man formuliere dieses Ergebnis mit Hilfe der Häufigkeit der er- 
Nn>X 
folgreichen Versuche unter n Versuchen insgesamt. 


(Mit Bezeichnungen von Aufgabe 29.) Man zeige: Gilt 


so konvergiert (DvoRETZKy [1}) die Folge {X,} mit der Wahrscheinlichkeit 1 gegen Null. 


Hinweis. Man beweise zunächst den folgenden Hilfssatz: Es sei , 20 (vn =1,2, ...), 
ferner 
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Es existiert dann eine Folge {n,} natürlicher Zahlen derart, daß n,,, — rn; = o(n,) und 
oo 


- Day, < 00 für n;— 00 ist. 
1 


31. Aus der vorhergehenden Aufgabe ziehe man die Folgerung, daß die Häufigkeit der er- 
folgreichen Versuche in der Folge der paarweise unabhängigen Ereignisse A,, für die 
P(A,) =» = const ist, mit der Wahrscheinlichkeit i gegen p konvergiert. (Man ver- 
gleiche hierzu auch Aufgabe 40.) 


32. Die Ereignisse A, (k=1,2,...) mögen die gleiche Wahrscheinlichkeit P(A)=r 
(<»p< 1) haben. 


a) Man zeige, daß P(limsup 4,) = p ist. 


ko 


b) Man gebe ein Beispiel einer Folge {A,} an, für die zn up A)=p gilt. 


33. Wir betrachten die Folge der Ereignisse A, (k = 1,2, ...) Aue den Wahrscheinlichkeiten 
P(A,) und die Zufallsvariablen Y, mit 
P(Y,=1)=Pi4,), PY,=0)=1-P(4,). 
Wir nehmen an, daß O0 < P(A,)<1 ist und daß für k=1,2,... und für beliebige 
Werte %,, Ya, ..., 4, der Zufallsvariablen Y,, Y, .-., Y, die Beziehungen 
0<m Ss PldalyerowW)SmM<1, 
2, P(A)<p, 


gelten. Man zeige, daß dann die folgenden Relationen erfüllt sind (Borer [1], [2]): 
Ist 3 pi < oo, soist Pflim sup 4,) = 0; 


k->c0 


ist PT = oo, soist P(lim sup A.) = 1. 


ko 
34. (Fortsetzung). 
a) Wir setzen für k>n 


Pr = P Asp = put nm), 
Pan P(4,). 


& oo 
Man zeige, daß P(lim sup 4,) = 0 dann und nur dann gilt, wenn lim P2 Pak = 
ist (Love [3)). k>oo m>oo k=n 


b) Man zeige, daß Ar sup A,) — 1 dann und nur dann gilt, wenn > P(AynlYo ..%n) 


E00 
= oo'ist, wobei nur die Folgen %,, Ya, %5 ... zu berücksichtigen ein in denen endlich 
oft y„=1 und P(y, Yo Ya +--,%r) = 0 ist (Nase [1}). 


35. (Verallgemeinerung des Lemmas von BOREL-CANTELLTI, die wir Erpös und Ranyı [2] 
verdanken.) Es sei {A} (k= 1,2, ...) eine Folge zufälliger Ereignisse derart, daß 


3 PA)=» (*) 
gilt. 
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a) Man zeige, daß Pflim-sup 4,) =1 gilt, wenn neben (*) die Beziehung 


E00 


nn 1 3 (**) 


erfüllt ist. 


b) Man beweise unter Verwendung des Ergebnisses von a), daß die Behauptung von a) 
gültig bleibt, falls die Formel (*) gilt und die Formel (**) entweder durch die Annahme 
ersetzt wird, daß die Ereignisse A, paarweise unabhängig sind, oder aber durch die 
Voraussetzung, daß für alle %k und I (k # I) die Beziehung 


P(4,A) = P(A,) P(A,) 
gilt. 


36. Wir setzen = P(4,) und y = P(AyalAy..„ Ag mit 0o<p <L0<y<i 
(k=1,2,...). 


a) Man zeige: Eine notwendige und hinreichende Bedingung dafür, daß 


a _ 
pP | N A) >0 
k=1 
gilt, ist 
Du=m. (*) 
k 
b) Man zeige: Gilt die Gleichung (*) und darüber hinaus 

>23 PRF®, ö (**) 
k 


so ist P(limsup 4,) =1. 
k>o 
c) Man zeige, daß die Formel (**) nicht aus (*) folgt. 
37. Kann der zentrale Grenzwertsatz für eine Folge unabhängiger Zufallsvariabler gelten, 


obwohl das Gesetz der großen Zahlen für diese Folge nicht gilt? [Man vergleiche hierzu 


1 
Aufgabe 13b für «> 3 Wie lautet die Antwort, wenn wir annehmen, daß die Zufalls- 


variablen der betrachteten Folge die gleiche Verteilung haben? 


38. a) Die Zufallsvariablen X, (k=1,2,...) seien unabhängig und mögen die gleiche Ver- 
teilungsfunktion F(x) haben. Man zeige, daß die Folge 


nr 


19* 
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dann und nur dann gegen eine gewisse Konstante a stochastisch konvergiert, wenn die 
charakteristische Funktion o(t) der Zufallsvariablen X, an der Stelle 0 differenzierbar 
ist und 9(0) = ie gilt. 
Hinweis. Verfahren 1. Man verwende den Satz von KoLmoGoRrorr [7], nach dem, wenn 
die Folge {Y,} stochastisch gegen a konvergiert, die Beziehungen lim z«P([X,|> 2) =0 


z ia] 
und a = lim f xdF(x) gelten, und stütze sich anschließend auf das Ergebnis von 
EI —I z 
PITMAN (siehe Aufgabe 4.8.9b). 
Verfahren 2 (EHRENFEUCHT und Fısz [1]). Man verwende den Hilfssatz: Ist die Funktion 


[i 
y(t) in den Intervallen (—oo, 0) und (0, oo) stetig und gilt lim y (+) =0 für jedes 
t=0, so ist lim pt) = 0. m N 


u) 
Siehe auch Dvavs& [2]. 


b) Man konstruiere eine Folge unabhängiger Zufallsvariabler, für die das schwache 
Gesetz der großen Zahlen im Sinne der Aufgabe 38a gilt, während das starke Gesetz 
der großen Zahlen nicht gilt. 


39. Es sei {X} (k=1,2,...) eine Folge unabhängiger Zufallsvariabler, für die #(X,) = 0 
ist (k=1,2,...). Wir definieren die folgenden Zufailsvariablen: 


X für 1X] <R, 1 # 
Kur = n 
0 für. |X,! zn, N Ki 


Man zeige, daß (Kormocororr [1}) die Folge {Y,) dann und nur dann stochastisch 
gegen Null konvergiert, wenn die drei nachstehenden Beziehungen erfüllt sind: 


n 
PAZEO 2n—0, (*) 
= 
1. 
— 3 EX) >0, (**) 
N 
ER ER 
Sa P3 D’(X,) = (***) 


‚Anmerkung. Wie BrEIMan [1] gezeigt hat, läßt sich die Beziehung (***) nicht durch 


ersetzen. 


40. Es sei {X,} eine Folge paarweise unabhängiger Zufallsvariabler. Man zeige: Existieren 
die Varianzen D2(X,)(k=1,2,...) undsind diese gleichmäßig beschränkt, so gilt für die 
Folge {X} das starke Gesetz der großen Zahlen (RascHman [1]). 


41. Es seiendie X, #=1,2,...,n) unabhängige Zufallsvariable, und es sei #(X,) = 0 und 
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0< D2(X,) ü=1,2,...,n). Ferner sei {c;} eine nichtwachsende Folge positiver Kon- 
stanten. Wir setzen j 


k 
Y,=)Yx; (k=1,2%,...,n). 
i=1 


a) Man zeige, daß für jedes e> 0 sowie für alle j und !(1<j<I!<n) die folgende 
Ungleichung gilt (HAser und R&nvı [1]): 


ı 
pP ß max c.|Y,| > °) Ss = ; (dos) +3 aa). 
IT i=j+1 

b) Man leite unter Verwendung dieser Ungleichung den Satz 6.12.1 her (der Beweis 

dieses Satzes wird sich dadurch erheblich vereinfachen). 

In der nachfolgenden Aufgabe führen wir das Gesetz des iterierten Logaritkmus für die 
Binomialverteilung an, das von CHinTscHin [8] bewiesen wurde, Verallgemeinerungen 
stammen von KOLMOGOROFF [16], Ernös [1] und Feruer [10]. 


42. Die Zufaällsvariablen X, (n = 1,2,...) mögen eine Binomialverteilung haben, und es sei 
Y, durch (6.7.2) definiert. Man zeige, daß dann 


Y 
P lim sup ——ı—— -1)= 1, 
n>o YV2loglog r 
Y 
P [lim int ———— = —1| =1 
n>o Y2loglog n 


gilt. 
Hinweis. Man verwende die Ungleichung von Aufgabe 41. 


43. Es sei {X} (k= 1,2, ....) eine Folge unabhängiger Zufallsvariabler. Man zeige, daß dann 
a) die Wahrscheinlichkeit für die Konvergenz der Reihe 


NxX,=Y (*) 
kei 


entweder 1 oder 0 ist; 


b) die Reihe (*) dann und nur dann stochastisch konvergiert, wenn sie mit der Wahr- 
scheinlichkeit 1 konvergent ist (L&vy [3], MARcINKIEwIcZ und ZyamunD [1)); 


c) wenn die beiden Reihen 


Zum), Da 


konvergent sind, die Reihe (*) mit der Wahrscheinlichkeit 1 konvergiert und darüber 
hinaus 


Ei?) = IE) 
’=1 


Din = N D&) 
k=1 


ist. 
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44. 


45. 


46. 


47. 


48. 


49, 


Es sei {X} (k= 1,2, ...) eine Folge unabhängiger Zufallsvariabler. Wir setzen 


X k für IX rl zZ 1 Pi 
Zr = 
0 für [X,]>1. 
Man zeige, daß unter dieser Bedingung die Reihe (*) der Aufgabe 43 dann und nur dann 


mit der Wahrscheinlichkeit i konvergiert, wenn gleichzeitig die nachstehenden drei 
Reihen konvergent sind: 


YPuX,>1, DEM), IDZy. 
k=1 k=1 k=1 


Man nennt diesen Satz den Dreireihensatz (CHintscHin und KoLMOGOROFF [1]). 


Der Vektor (X,, X, ..., X,) möge die durch (6.13.1) gegebene Verteilung haben; hierbei 
können die Wahrscheinlichkeiten p, Funktionen von » sein, weshalb wir sie durch 2; 
bezeichnen. Man bestimme die Klasse der möglichen Grenzverteilungen der Folge der 
Verteilungsfunktionen der Zufallsvektoren (AuXı + Bay --» Aarfr + Bar) für be- 
liebige Konstantenfolgen {A4,;} und {B,,} (Fısz [2]). 

Hinweis. Man verwende die mehrdimensionalen Analoga des Satzes 6.6.1 und den Satz 
von CHINTSCHIN (vgl. Aufgabe 6). 


Es sei {X,} eine Folge unabhängiger Zufallsvariabler mit gleichen Verteilungen, und 
es existiere m = E(X,) und 0? = D2(X,). Ferner sei N eine ganzzahlige, von X, X, ... 
unabhängige Zufallsvariable mit dem Erwartungswert c= E({N) und mit d?= D?(N). 


Kö 
Ferner möge die Verteilung von N vom Parameter A abhängen. Wir setzen X = X. 
k=1 


a) Man zeige, daß E(X) = me und D2(X) = co? -+ m2d? ist. 

b) Man beweise: Hat N für A—oo die asymptotische Normalverteilung N (c; d), so 
besitzt X die asymptotische Normalverteilung N (me; yes + m?qR). (Vergleiche 
Rosgrns [1]; eine weitgehende Verallgemeinerung stammt von DOBRUSCHIN [4].) 

ce) Man bestimme die Grenzverteilung der Zufallsvariablen X mit zusammengesetzter 
Binomialverteilung (siehe 5.13.A) für A—o. 


Die Folge {X} (k = 1,2, ...) möge alle Bedingungen des Satzes 6.8.1 fürm = Oundo =1 
erfüllen, und es sei N eine ganzzahlige Zufallsvariable, deren Verteilung von A> 0 


N 
abhängig ist; ferner möge En für A—0o stochastisch gegen eine positive Konstante 


X N 
konvergieren. Man zeige, daß dann die Zufallsvariable — mit X = DI’X x die Grenz- 
N k=1 


verteilung N (0; 1) besitzt (Anscomsge [1]; siehe auch Rönvı [7]). 


Man beweise: Konvergiert eine Folge unbegrenzt teilbarer Verteilungsfunktionen (vgl. 
Aufgabe 5.14.25) gegen eine nicht ausgeartete Verteilungsfunktion F(x), so ist auch 
F (x) eine unbegrenzt teilbare Verteilungsfunktion. 


Man beweise (PöLya [3]): Konvergiert die Folge der Verteilungsfunktionen F,(x) für 
n 00 gegen eine stetige Verteilungsfunktion F (x), so konvergiert sie gegen F(x) auch 
gleichmäßig bezüglich x. 

Wegen einer Verallgemeinerung dieses Ergebnisses siehe Ranaa-Rao [1]. 
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50. Der Umfang einer Kreisscheibe, die um eine drehbare Achse an einem Tisch befestigt ist, 
sei in 2m Bögenstücke unterteilt, die abwechselnd rot bzw. schwarz gekennzeichnet sind 
und die Zentriwinkel 6, bzw. ö, haben. Anfänglich markiert ein am Tisch befestigter 
Pfeil einen Nullpunkt auf dem Umfang der Kreisscheibe. Nun wird die Kreisscheibe in 
eine Drehbewegung versetzt. Wir bezeichnen mit A das zufällige Ereignis, das darin 
besteht, daß der Pfeil nach Stehenbleiben der Kreisscheibe auf einen roten Punkt auf 
dem Umfang der Kreisscheibe zeigt. Ferner bezeichnen wir mit X den Winkel, um den 
sich die Kreisscheibe dreht. Ist F(x) die Verteilungsfunktion der Zufallsvariablen X, so 
gilt 


de Y ha) dF («), 
0 

SER hia)=1 für ki, +6G)SeC<Skiß, + 65) 3 6, em =0,1,2,...) und k(ia)=0 

für alle übrigen « ist. 

a) Man zeige: Hat X eine beliebige Dichtefunktion f(x), so ist lim P(A) = öy/(dı + 6); 
wenn m — 00,6, — O und ö, — 0 geht, wobei ö,/6, konstant bleibt und /(x) fest gehalten 
wird (Porncar& [1], Fr£caer [1], Hostınsky [1)). 

b) Nun seien 6, und 6, konstant. Wir betrachten aufeinanderfolgende Umdrehungen 
der Kreisscheibe, wobei wir bei den einzelnen Umdrehungen die Kreisscheibe nicht in 
die Ausgangslage zurückbringen. Wir bezeichnen mit X; den Winkel, um den sich 
die Kreisscheibe bei der ö-ten Umdrehung (=1,2,...) dreht. Ferner bezeichnen 
wir mit Y,, die Häufigkeit des Auftretens des Ereignisses A in den ersten » Umdrehun- _ 
gen. Man zeige, daß (RoBBiss [3]) 


De ö, 
P!limY,= —1 
N>X ö, + Ö, 


gilt, wenn die Zufallsvariablen X; #=1,2,...) eine beliebige gemeinsame Ver- 
teilungsfunktion mit Ausnahme der Möglichkeit haben, daß die X, eine gitterförmige 
Verteilung mit einem rationalen Vielfachen von x für die maximale Schrittweite 
h>0 aufweisen. 

Wir weisen darauf hin, daß auf Grund des starken Gesetzes der großen Zahlen von 
BoREL 


he Y= Pia] = 


RX 


wäre, falls wir nach jeder Umdrehung die Kreisscheibe in ihre Ausgangsstellung 
zurückgeführt hätten (siehe auch Aufgabe 14.6.8). 


7. MARKOFFSCHE KETTEN 


741. Einleitende Bemerkungen 


Bis jetzt haben wir uns hauptsächlich mit unabhängigen zufälligen Ereignissen 
und unabhängigen Zufallsvariablen beschäftigt. In den Anwendungen der Wahr- 
scheinlichkeitsrechnung kann man oft annehmen, daß die betrachteten zufälligen 
Ereignisse oder Zufallsvariablen unabhängig sind. Es gibt aber zahlreiche Probleme 
in Physik, Technik und anderen Anwendungsgebieten der Wahrscheinlichkeits- 
rechnung, in’ denen die Voraussetzung über die Unabhängigkeit nicht einmal 
näherungsweise erfüllt ist. Die Betrachtung abhängiger zufälliger Ereignisse und 
abhängiger Zufallsvariabler gehört mit zu den wichtigsten Aufgaben der Wahr- 
scheinlichkeitsrechnung. Wenn aber nicht mehr Unabhängigkeit vorausgesetzt 
werden kann, werden die Überlegungen der Wahrscheinlichkeitsrechnung sehr 
viel schwieriger. Das große Verdienst MARKorrs [2] besteht nun darin, daß er 
bei der Untersuchung von abhängigen Ereignissen ein Versuchsschema hervorhob 
(man sagt jetzt, dieses Versuchsschema bilde eine Markoffsche Kette), das als 
einfachste Verallgemeinerung des unabhängigen Versüchsschemas betrachtet 
werden kann. Die Markoffschen Untersuchungen waren der Ausgangspunkt einer 
weitgehenden Entwicklung, die zur Entdeckung eines wichtigen neuen Gebiets 
der modernen Wahrscheinlichkeitsrechnung führte, nämlich zur Theorie der 
stochastischen Markoffschen Prozesse. Einige Elemente dieser Theorie sind Gegen- 
-stand der Betrachtungen dieses und des nächsten Kapitels. 

Die Markoffschen Ketten, von denen in diesem Kapitel die Rede ist, sind 
ebenfalls, wie wir in 8.2 sehen werden, Markoffsche Prozesse; aus didaktischen 
und historischen Gründen hielten wir es aber für angebracht, die Markoffschen 
Ketten gesondert zu behandeln. 


7.2. Homogene Markofische Ketten 


Wir setzen voraus, daß alle in diesem und im nächsten Kapitel vorkommenden 
bedingten Wahrscheinlichkeiten definiert sind (siehe 2.7). 

Wir betrachten eine Folge von Versuchen; als Ergebnis eines jeden Versuchs 
möge ein und nur ein Ereignis der endlich oder abzählbar vielen Ereignisse 
E,: Ea, #3, ... eintreten können; dabei sollen die Ereignisse E,,E,, ... einander 
paarweise ausschließen. Wir wollen diese Ereignisse Zustände oder Phasen nennen. 
Tritt das Ereignis E, ein, so wollen wir sagen, das System befinde sich im Zustand 
oder in der Phase E,. Das Symbol EB gebrauchen wir, um auszudrücken, daß der 
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Zustand E; beim k-ten Versuch realisiert wurde, während das Symbol ED be- 
deutet, daß E, die Anfangsphase des Systems war. Weiter bezeichnen wir mit 
2\® die bedingte Wahrscheinlichkeit dafür, daß sich das System nach dem k-ten 
Versuch im Zustand E, befindet, wenn es sich beim (k — 1)-ten im Zustand E, 
befand, d.h. 


pin = P( E®| Be»), 


Definition 7.2.1. Wir sagen, eine Folge von Versuchen bilde eine Markoffsche 
Ke:le, wenn für beliebige :,5,k =1,2,3,... die Gleichung 


2 = P(EW| ER») = P[EW|EN-D, EU», ..., ED, E0) (7.2.1) 
für beliebige | 
Ben BE 
erfüllt ist. 


Definition 7.2.2. Wir sagen, eine Versuchstolge bilde eine homogene Markoff- 
sche Kette, wenn für i,j,k =1, 2,3, ... die Wahrscheinlichkeiten p nicht von k 
abhängen: 


pi = Pi (k = 1, 3; . ..); (7.2.2) 


Die Wahrscheinlichkeit p;; heißt Übergangswahrscheinlichkeit vom Zustand E; 
in den Zustand E; während eines Versuches. 

Manchmal wollen wir eine zeitliche Terminologie gebrauchen, d. h., wir denken 
uns, daß während jeder Zeiteinheit ein Versuch ausgeführt wird, und sagen 
an Stelle von „beim %-ten Versuch geht das System vom Zustand EZ, in den 
Zustand E, über‘ auch „der Übergang findet im Augenblick i = k statt“. Außer- 
dem nehmen wir an, daß zu Beginn, d.h. im Moment ?=0, sich das System mit 
der Wahrscheinlichkeit P(#;) im Zustand Z,; befindet. Nach dieser Bezeichnungs- 

- weise ist p,;; die Wahrscheinlichkeit des Übergangs vom Zustand E,; in den Zustand 
E, während einer Zeiteinheit. 

Aus den Formeln (7.2.1), (7.2.2) und (1.5.7) erhalten wir für eine homogene 

Markoffsche Kette die Formel 


P(E,E,E,) = P(E,) P(E,|E,)- P(&,IE,_.) 
= P(E,) Pau" Pinerin? (7.2.3) 
die die Wahrscheinlichkeit des Produkts E,E,E,--E,, der Zustände in n 
aufeinanderfolgenden Versuchen angibt. 


Der Leser vergleiche die letzte Formel mit der Formel (1.5.7) und beachte 
den wesentlichen Unterschied zwischen ihnen. 
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Aus (7.2.3) folgt, daß die Wahrscheinlichkeit eines beliebigen Produkts von 
Zuständen dann gegeben ist, wenn man alle Übergangswahrscheinlichkeiten 9;; 
und alle Anfangswahrscheinlichkeiten P(E,) für =1,2,3,... kennt. 


7.8. Die Übergangsmatrix 


A. Die Matrix, deren Elemente die Übergangswahrscheinlichkeiten p;; sind, 
heißt die Übergangsmatrix der Markoffschen Kette. Wir wollen sie mit M, be- 
zeichnen: 

Pıı Pia Pıs ---\ 

Paı Pa2 Pas --- 

Paı Paa Pas - -- 


M,= 


Da alle Elemente p;,; Wahrscheinlichkeiten darstellen, sind sie nicht negativ. 

Das System befinde sich im Zustand #,. Das Ereignis, das darin besteht, 
daß sich das System nach einem Versuch entweder im’Zustand E; oder in einem 
der Zustände Z,,j = i, befindet, ist ein sicheres Ereignis. Da jedoch die Ereignisse 
E, einander paarweise ausschließen, folgt für = 1,2,3,... .die Gleichung 


P(ZEDIE) = Pu =1. (7.3.1) 


Die Summe aller Wahrscheinlichkeiten in jeder Zeile der Matrix M, ist also 
gleich Eins. Die Summe aller Wahrscheinlichkeiten einer Spalte braucht aber 
nicht gleich Eins zu sein. 


Beispiel 7.3.1. Wir betrachten die Folge von Versuchen eines Bernoullischen Schemas. 
Hier haben wir zwei Zustände, E, und E,, und für jeden Versuch ist 


Pu =Pı=P; 
Pa = 17219. 
Die Übergangsmatrix hat also die Form 
M, = € a 
pq 


Wie man leicht nachprüft, sind für jede Folge von unabhängigen Versuchen alle Zeilen 
der Übergangsmatrix einander gleich. 


Beispiel 7.3.2. In diesem Beispiel betrachten wir die sogenannte Irrfahrt eines Moleküls 
zwischen zwei Absorptionsschirmen. Das ist ein Modell für gewisse Erscheinungen, welche 
in der Physik häufig vorkommen. Das Molekül kann sich in einem der Punkte 1, 2,3,...s 
auf der x-Achse befinden; dabei bleibt es mit der Wahrscheinlichkeit Eins im Punkt 1, wenn 
es sich dort im Augenblick t befand. Dasselbe gilt für den Punkt s. Die Punkte 1 und s nennt 
man Absorptionsschirme. Befindet sich aber das Molekül im Moment t im Punkt :, wobei 
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2<iss—1 ist, dann kann es während einer Zeiteinheit mit der Wahrscheinlichkeit p 
zum Punkt © + 1 oder mitder Wahrscheinlichkeit = 1 — p zum Punkt i — 1 übergehen. 
Hier haben wir es mit einer homogenen Markoffschen Kette mit s Zuständen zu tun. Dabei 
besteht der Zustand Z, darin, daß sich das Molekül im Punkt befindet. Tatsächlich hängt die 
Übergangswahrscheinlichkeit vom Zustand’ ö (den das Molekül im Augenblick t inne hat) in 
den Zustand 5 (den das Molekül im Augenblick # -+ 1 inne hat) nur vom Zustand :, in dem 
sich das Molekül im Augenblick t befindet, ab, nicht aber von den Zuständen, in denen sich 
das Molekül in der Zeit vor i befand. Die Übergangswahrscheinlichkeit hängt auch nicht 
unmittelbar von der Zeit i ab (sie hängt nur vom Zustand im Augenblick i ab). Wir haben hier 
die Übergangswahrscheinlichkeiten 


Pu = Ps 1 

und für 2<i<s—1 
p für j=i-+1, 
Py= 3g=1l-p für j=ei-l, 
0 für die übrigen 5. 


Die Übergangsmatrix M, hat die Form 


O0 Er 0 
OD... v 
Og0Pp..... 0 


Beispiel 7.3.3. In der auf den Mendelschen Gesetzen aufgebauten Genetik nimmt man an, 
daß die vererbbaren Merkmale von Genen abhängen. Die Gene treten immer zu Paaren auf. 
Im einfachsten Fall, auf welchen wir uns hier beschränken wollen, soll jedes Gen eine der 
zwei Formen A oder @ besitzen. Wenn beide Gene eines betrachteten Organismus von der 
Form A sind, sagen wir, daß der Organismus die genotypische Struktur A.A besitzt; falls aber 
ein Gen von der Form A, das andere jedoch von der Form a ist, sprechen wir von der geno- 
typischen Struktur Aa und endlich, falls beide von der Form « sind, von der genotypischen 
Struktur aa. Weiter nimmt man an, daß die Keimzellen nur ein Gen enthalten. Also enthalten 
die Keimzellen eines Organismus von der genotypischen Struktur AA bzw. aa das Gen A 
bzw. a, während die Keimzelle eines Organismus mit der genotypischen Struktur Aa das 
Gen A oder a, beide mit der gleichen Wahrscheinlichkeit, enthalten kann. Ein Nachkomme 
erhält von jedem seiner Eltern ein Gen, und zwar nach dem Bernoullischen Schema. Das ist 
so zu verstehen: Man betrachtet die Gesamtheit der Gene aller zu derselben Generation 
gehörigen Individuen, zu der die Eltern des betrachteten Nachkommen gehören. Aus dieser 
Gesamtheit lost man nach dem Bernoullischen Schema zwei Gene aus. Ebenso erhalten wir 
die genotypische Struktur von N Nachkommen als Ergebnis von 2N derartigen Auslosungen. 

Die Individuenanzahl sei nun in allen Generationen gleich N. Das kann man dadurch 
erreichen, daß man aus jeder Generation eine entsprechende Anzahl von Individuen heraus- 
greift. In einer Generation befinden sich also 2N Gene. Haben in einer gewissen Generation 
(<= 2N) unter den 2N Genen die Gestalt A, so sagen wir, die Gesamtheit befinde sich 
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im Zustand Z;. Aus dem angenommenen Fortpflanzungsschema ersieht man, daß man es mit 
einer homogenen Markoffschen Kette mit 2N -+ 1. möglichen Zuständen E,E1 -.., Een 
zu tun hat. Die Übergangswahrscheinlichkeiten vom Zustand E,, in dem sich die eine Genera- 
tion befindet, in den Zustand E, in dem sich die nächste Generation befindet, sind durch 


le lez 


gegeben. 

Hier sehen wir, daß die Zustände Z, und E,y wie Absorptionsschirme wirken. Befindet 
sich nämlich die Gesamtheit einer Generation in einem dieser beiden Zustände, dann verläßt 
sie ihn nicht mehr. Haben z. B. alle Individuen die genotypische Struktur AA, dann kann 
kein Nachkomme Gene von der Gestalt a haben (vgl: Mauzcor [1]). 


Beispiel 7.3.4. In diesem Beispiel betrachten wir eine Irrfahrt ohne Absorptionsschirme. 
Die Menge der Zustände sei die Menge der natürlichen Zahlen, und die Übergangswahrschein- 
lichkeiten seien durch die folgenden Formeln gegeben: 


Pun=g=1-P 
p für i=1,2,3,.,j=i+l, 
Pig für i=2,3,.,j=i-—l, 
0 für die übrigen Paare (i, j). 
Die Zahl Eins nennt man Reflexionsschirm. 
Die Übergangsmatrix hat die Form 
qgp0000... 


. Beispiel 7.3.5. Wir kehren in diesem Beispiel zum Pölyaschen Schema zurück und wollen 
die Bezeichnungen aus 5.4 benutzen. Hier gibt es zwei Zustände, nämlich den Zustand E,, 
der im Ziehen einer weißen Kugel besteht, und den Zustand Z,, der im Ziehen einer schwarzen 
Kugel besteht. Dabei sind die entsprechenden Anfangswahrscheinlichkeiten gleich 


[4 


Y’ BT ge 


pP, = 


Die Übergangswahrscheinlichkeit dafür, aus dem Zustand E, bei der zweiten Ziehung 
E) 


in den Zustand E, zu gelangen, ist gleich vn Dagegen ist die Wahrscheinlichkeit dafür, 


3 +8 
daß wir beim dritten Mal eine weiße Kugel erhalten, wenn beim zweiten Mal E, eintrat, gleich 
b+2s 
N-+2s 
bei der ersten Ziehung der Zustand E, eintrat. Die Folge der Versuche eines Pölyaschen 
Schemas bildet also keine Markoffische Kette. 

Aber wir können auch aus dem Pölyaschen Versuchsschema eine Markoffsche Kette 
bilden; dazu müssen wir nur die Zustände anders definieren. Wir wollen sagen, das System 


b- 
‚ wenn bei der ersten Ziehung der Zustand E, eintrat, und gleich N m ‚ wenn 
8 
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befinde sich nach % Ziehungen im Zustand Z, (= 0,1,2,...,k), wenn man bei diesen k 
Ziehungen i weiße Kugeln erhalten hat. Dann kann sich das System bei der (k + 1)-ten 
Ziehung entweder wieder im Zustand E, befinden oder aber zum Zustand E,,, übergehen. 
Das hängt nur davon ab, ob wir bei der (k + 1)-ten Ziehung eine schwarze oder eine weiße 
Kugel erhalten haben. Die Übergangswahrscheinlichkeiten sind dabei von den Ergebnissen 
der ersten k — 1 Versuche unabhängig, sie sind jedoch von der Versuchsnummer abhängig. 
Hier haben wir es also mit einer inhomogenen Markoffschen Kette zu tun, deren Übergangs- 
wahrscheinlichkeiten p4*" durch 


(c+(k-i)s 

| Fr N-+ks 
A 

5 


für j=i, 


für jei+l, 
ks 


© 


für 5j#Li+1 
gegeben werden. 


B. Die Übergangswahrscheinlichkeit dafür, in einer homogenen Markoffschen 
Kette nach n Versuchen vom Zustand E; in den Zustand E,; zu gelangen, wollen 
wir mit 2,;(n) bezeichnen. Wir wollen zeigen, wie man p;,(r) durch 9,; ausdrücken 
kann, und beginnen mit der Berechnung von 9,;,(2). Das. Ereignis A, das im 
Übergang des Systems vom Zustand E, in den Zustand E, besteht, ist gleich 
der Summe von Ereignissen A;. Dabei bezeichnet A, den Übergang vom Zustand 
E, zu E, und von E, zu E,. Also gilt für jedes Zahlenpaar (i, 5) 


P;(2) = 3 Pu Prjs (7.3.2) 
k 


wobei die Summation über alle möglichen Zustände zu erstrecken ist. 
Durch ähnliche Überlegungen erhält man für n=3,4, ... 


Pin =2 Dir(M) Dun — m); (7.3.3) 


dabei ist m eine natürliche Zahl, die der Ungleichung 1<m<n genügt. Die 
Gleichung (7.3.3) wird auch Markoffsche Gleichung genannt. Sie ist für die Theorie 
der homogenen Markoffschen Ketten von grundlegender Bedeutung. . 

Die Matrix, deren Elemente die Übergangswährscheinlichkeiten 9;;(n) sind, 
wollen wir Übergangsmatrix in n Schritten nennen und mit dem Symbol M, 
bezeichnen. Die Abhängigkeit der Matrizen M,„ und M, läßt sich leicht angeben. 
Zuerst wollen wir die Abhängigkeit der Matrizen M, und M, bestimmen. Aus der 
Formel (7.3.2) erkennt man, daß das Element der Matrix M,, das zur i-ten 
Zeile und j-ten Spalte gehört, gleich der Summe der Produkte der Elemente der 
i-ten Zeile mit den Elementen der j-ten Spalte der Matrix M, ist. Nach der 
Multiplikationsregel für Matrizen erhalten wir 


M,=M:. 


302 7. Markoffsche Ketten 


Wenn wir vollständige Induktion anwenden und die Formel (7.3.3) berücksichtigen, 
erhalten wir 


M„=Mt. | (7.3.4) 


71.4. Ein Ergodensatz 


A. Diesen Paragraphen beginnen wir mit einer von KOLMOGOROFF [9] stammenden 
Klassifikation der Zustände einer Markoffschen Kette (vgl. auch die Aufgaben 
7.6.5 bis 7.6.8). Das soll uns die Deutung der Voraussetzungen des Ergodensatzes 
erleichtern. 


Definition 7.4.1. Wir nennen einen Zustand Z; vorübergehend, wenn es einen 
Zustand E, und eine natürliche Zahl %k gibt derart, daß p,;(k) > 0 und p,:(m) = 0 
für m =1,2,3,... ist. 


Definition 7.4.2. Ein Zustand E, heißt wesentlich, wenn aus der Existenz 
einer natürlichen Zahl %k, mit der Eigenschaft »,,(k;) > 0, die für einen gewissen 
Zustand E, vorhanden sein soll, die Existenz einer natürlichen Zahl m; mit der 
Eigenschaft 9,;(m;) > 0 folgt. 


Definition 7.4.3. Ein wesentlicher Zustand E; heißt periodisch, wenn es eine 
natürlicheZahl d > 1 gibt, so daß für alledurch d nicht teilbaren % die Beziehung‘ 
Pin) =0 gilt. 

Im Beispiel 7.3.2 sind die Zustände Z, und Z, wesentlich und nicht periodisch, 
während alle übrigen Zustände vorübergehend sind. Wir können nämlich vom 
Zustand E&; = 2,...,s— 1)ini— 1 Schritten mit positiver Wahrscheinlichkeit 
zum Zustand EZ, übergehen, während die Wahrscheinlichkeit dafür, aus dem 
Zustand Z, herauszukommen, gleich Null ist. Wir bemerken noch, daß es nicht 
möglich ist, vom Zustand Z, zum Zustand EZ, überzugehen, ebenso ist auch 
der Übergang von E, zu E, unmöglich, obwohl beide Zustände wesentlich sind. 
In diesem Zusammenhang bringen wir noch eine weitere Definition: 


Definition 7.4.4. Wir sagen, eine Menge W von wesentlichen Zuständen 
bilde eine einzige Klasse, wenn es zu je zwei Zuständen Z, und E, aus W eine 
natürliche Zahl m;; mit der Eigenschaft 9,,;(m;;) > 0. gibt. 

Die Beispiele 7.4.1 bis 7.4.4 werden die hier eingeführten Begriffe erläutern. 


B. Wir wollen nun zur Darstellung des Ergodensatzes übergehen. Dieser Satz 
wird die Frage beantworten, wie sich die Wahrscheinlichkeiten 9,,(n) für n —oo 
verhalten. Mit anderen Worten: Hat der Anfangszustand E, bei einer genügend 
großen Anzahl von Übergängen einen Einfluß auf das Eintreten des Ereignisses 
E,? Der Satz 7.4.1 gibt eine Bedingung dafür an, daß bei einer homogenen 
Markoffschen Kette mit endlich vielen Zuständen die Wahrscheinlichkeit 9;;(r) 
für n —0o0o gegen eine von : unabhängige Zahl p, konvergiert ( —=1,2,..., Ss). 
Der Satz erschöpft nicht den gesamten Inhalt dieses Problems. So betrifft er zum 
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Beispiel nicht Markoffsche Ketten mit abzählbar vielen Zuständen. Besser infor- 
mieren über dieses Gebiet kann sich der Leser in den Büchern von FELLER [7], 
CHUnG [5] sowie von KEMENnEY und Sneut [1], ferner in den Arbeiten von Cuune 
[2], [3] (vgl. auch Aufgabe 7.6.9). j 


Satz 7.4.1. Essei M, = (P;;) die Übergangsmatrix einer homogenen Markoffschen 
Kette mit endlich vielen Zuständen E,, ..., E,. Wenn es eine natürliche Zahl r gibt 
derart, daß die Elemente p,,(r) der Matrix M, in s, Spalten (s, 21) der Relation 


min 9;()=6>0 (7.4.1) 


1zsiss 


genügen, dann gelten die Beziehungen 


lim 9,;(n) = pP; G=12,..,8)}; (7.4.2) 


Nn—X 


hierbei ist 9; > 6 für diejenigen j, für welche (7.4.1) gilt. Außerdem ist 


$ 
Zp—1 
jel 
und 
en 
Ip3(n) — p;| = (1 — 516)" (7.4.3) 


In den Voraussetzungen des Satzes wird gefordert, daß alle Elemente wenig- 
stens einer Spalte der Matrix M, positiv sind. Der Satz 7.4.1 stellt eine gewisse 
Modifikation eines Satzes von MARKoFF [2] dar, in welchem man fordert, daß 
für ein gewisses natürliches r alle Elemente p,;(r) der Matrix M, positiv sind. 
Die Behauptung des Satzes lautet dan , >05 =1,2,...,s). 

Den Satz von 7.4.1 bezeichnet man als Ergodensatz. Diese Bezeichnung wollen 
wir am Ende von 7.4 erklären. 


€. Bevor wir zum Beweis des Satzes 7.4.1 kommen, wollen wir einige Beispiele 
behandeln, die den Sinn der Voraussetzung dieses Satzes erläutern sollen. 


Beispiel 7.4.1. Wir kehren zum Beispiel 7.3.2 zurück und setzen der Einfachheit halber 
s=3. Es ist also 


100 
M,= a0 pP). 
001 


Daraus berechnen wir 


100 2 100 
M%=M=-|a0plig0p)=|u0p|=M.. 


001/ \oo1 001 
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Allgemein ist also 
M,„=M:;. 


Die Voraussetzungen des Ergodensatzes sind hier nicht erfüllt. Es gibt kein r derart, daß 
M, wenigstens eine Spalte mit lauter positiven Elementen »,,(r) hätte, Offenbar ist gleich- 


zeitig die Behauptung des Satzes 7.4.1 nicht erfüllt; denn es ist p,,(r) =1, also lim p,,(r) = 1, 
NO 
während lim p,,(n) =g und lim p,(n) = 0 ist. Die Unregelmäßigkeit dieser Markoffschen 
no " RX ® 
Kette ist durch die Existenz zweier wesentlicher Zustände Z, und Z, bedingt, die nicht in 


einer Klasse liegen; denn der Übergang von dem einen zum anderen ist unmöglich. 


Beispiel 7.4.2. Wir betrachten eine homogene Markoffsche Kette mit den vier Zuständen 
E,, Ey, E,, E, und der Übergangsmatrix 


1 1 
00 < — 
2 2 
i 1 
00 — — 
2 2 
M= 
11 
—— — 0 0 
2 
11 
— —0 9 
2 2 l 
Dann ist 
jı 1 
— —0 0 
2 2 
1 1 
— —0 9% 
5 2 2 
= ı 1 
0 .°0-< < 
2. 2 
1 i 
o 0 — — 
2 2 


‚und allgemein für k=1,2,3,.... 
Ma = Mi» 
My = Ma. 


Auch hier ist weder die Voraussetzung noch die Behauptung des Satzes 7.4.1 erfüllt. Der 
Leser beachte die in dieser Kette auftretende Periodizität. Alle Zustände sind wesentlich, 
aber periodisch. So kann z. B. das System von Zustand E, zum Zustand E, nur nach einer 
geraden Anzahl von Schritten mit positiver Wahrscheinlichkeit zurückkehren. Diese Perio- 
dizität ruft eine Unregelmäßigkeit hervor, so daß die Behauptung des Satzes 7.4.1 nicht gilt. 


Beispiel 7.4.3. Wir kehren.zum Beispiel 7.3.4 zurück. Dabei nehmen wir an, daß drei 
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Zustände vorhanden sind und die Matrix M, die Form. 


qpV 
M,=1ig0» 
0gP 
hat. Dann ist 
tr gap m 
M,= 2g9p 
24 qp+ m 


Die Voraussetzungen des Satzes 7.4.1 sind also erfüllt. Wir weisen darauf hin, daß alle drei 
Zustände wesentlich und nicht periodisch sind und daß sie nur eine einzige Klasse bilden. 


Später werden wir zeigen, wie man für dieses Beispiel die Grenzwahrscheinlichkeiten be- 
> 
rechnen kann. 


Beispiel 7.4.4. Wir wollen das Beispiel 7.4.1 so ändern, daß die Übergangsmatrix M, die 
Form 


100 
M,={|g0» 
04» 


hat. In dem so gewonnenen Beispiel kann man den Zustand Z, als Absorptions- und. den 
Zustand E, als Reflexionsschirm auffassen. Es ist 


10 0 
M,=igrg 
@prggp+p® 


Dann sind die Voraussetzungen des Satzes 7.4.1 erfüllt. Leicht erkennt man, daß der Zu- 
stand E, wesentlich und nicht periodisch ist, während die beiden anderen Zustände vorüber- 
gehend sind. Später zeigen wir (vgl. Beispiel 7.4.6), daß die Grenzwahrscheinlichkeiten #, 
und ?3 gleich Null sind. 


Die obigen Beispiele legen die Vermutung nahe (es kann nachgewiesen werden, 
daß diese Vermutung tatsächlich zutrifft), daß die Voraussetzung des Satzes 
7.4.1 erfüllt ist, wenn in einer homogenen Markoffschen Kette mit endlich vielen 
Zuständen alle wesentlichen Zustände nichtperiodisch sind und nur eine Klasse 
bilden. Dabei ist nicht ausgeschlossen, daß einige Zustände vorübergehend sind. 
Sind jedoch alle Zustände wesentlich und nichtperiodisch und bilden sie dann 
nur eine einzige Klasse, so gibt es ein r, für das alle Elemente p,,(r) der Matrix 
M, positiv sind und damit auch größer als ein gewisses &> 0; denn die Anzahl 
der Elemente ist endlich. Es gilt dann der Markoffsche Satz im ursprünglichen 
Wortlaut. 

Kaucky [7] und Kox&onf? [1] haben für Anwendungen günstige notwendige 
und hinreichende Bedingungen für die Gültigkeit des Ergodensatzes für homogene 
Markoffsche Ketten angegeben. Diese Bedingungen werden durch Eigen: werte 
der Matrix M, ausgedrückt. 


20 Fisz 
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D. Wir gehen jetzt zum Beweis des Satzes 7.4.1 über. 
Beweis. Dazu führen wir die folgenden Bezeichnungen ein ®=1, 2,3, ...): 


db,(w) =minp,(v), 
isiss 


B;(v) = max p,;(%). (7.4.4) 
1ziss 
Unter Berücksichtigung der Formel (7.3.3) erhalten wir für v=1,2,... 
8 
se +)=minp;w+1)=min % PaPpı;(v) 


Isiss Isiss k=1 


| zmin 3 Pub;e) = b;,(w), 


1<i<s k-1 
also 
se +1)2b;l). (7.4.5) 
Ebenso erhalten wir . 
Bew +D)=sB;(). (7.4.6) 


Aus (7.4.5) und (7.4.6) folgt 
3) <b2)<--<B,2)<B;l). (7.4.7) 


Die Zahl r erfülle die Voraussetzung unseres Satzes. Es seien i und m fest 
gewählt, und die Bezeichnungen 2& + sowie 27 sollen besagen, daß die Sum- 


mation über alle diejenigen k zu Srtredken el; für die pulr) > Pr (?) bzw. 
Pir(f) < Pme(r) ist. Dann erhalten wir 


2 Pie (r) — Pme(r)] + 2 put) — Pak (F)) = 0. (7.4.8) 


Es sei nun n>r. Wir betrachten die Differenz 


B;(n) — b;(n) = max p;,;(n) — min 2„;(n) 
1ziss IiSmss 


= max F Pir(r) Pu; (n — r) — min B> Prk(?) Pr; (n — r) 


1ziss k=1 Iismss k=1 
s 

= max N [Pir(r) < Pk (r)] Prs(n — r) 
I<si,mss k=1 


< max [2"1pa (r) — Pre (r)) B;(n — r) 


1Si,mss 


+ 2 [Pu(r) — Ps (r)] d;(n — nl 
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Wenn wir die Formel (7.4.8) berücksichtigen, so erhalten wir 


By) - dm) max Zt[pulr) — Pas] LBotm — n) — biln — ni] 
[Bm - Ne) max Zripat) ul) 
Ze (7.4.9) 


Die Relation (7.4.1) bestehe für w Glieder der Summe 3/*. Offensichtlich ist 
k 
w< s,, wenn s, die Anzahl der Spalten bedeutet, für die (7.4.1) gilt. Es ist also 


— + Pmk(r) = —wö. 
k 


Da ferner für s, — w Glieder der Summe 2 - die Beziehung (7.4.1) erfüllt ist, er- 
halten wir 


dal) zs1- (ss —-wösı 
BE . 

und daraus 
Alp) - m) EI - 1 -W-wW=1— sıö. (7.4.10) 
k 

Aus den Formeln (7.4.9) und (7.4.10) folgt die Ungleichung 

B;(n) — (m) < (1 — 10) [Bin — rn) bin — nl. 

Ebenso ist (für 2 > 2r) 


B;(n) — b;(n) <= (1 — 516)? [B;(n — 2r) — b,(n — 2r)]. 


Wenn wir das B -mall) wiederholen, erhalten wir 
1 


Bun) bin) < (1 - Bd 1B ( > B ) ; ( = B ie 


(7.4.11) 
Hieraus folgt, da ö>0 und s, 21 ist, die Ungleichung 


0=<1—-sö<1. 
Auf Grund der Formel (7.4.7) konvergieren die Folgen {b,(n)} und {B,;(r)}, 


?) Unter [4] verstehen wir die größte ganze Zahl, die nicht größer als A ist. 


20* 
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während sich aus (7.4.11) ergibt, daß diese Folgen einen gemeinsamen Grenzwert 
haben. Also ist 


lim max p,;(n) = lim min p,;({n) = p;. (7.4.12) 


no 1SiSs$ n>X 1SisSs 


Die Formel (7.4.2) ist damit bewiesen. Ferner besteht offenbar für diejenigen 
5, für die die Beziehung (7.4.1) gilt, die Ungleichung 9; > ö. Die Gleichung 
62 


2»; =1 ist ebenfalls leicht einzusehen. 
ji 
Uns bleibt nur noch die Formel (7.4.3) zu beweisen. Wir erhalten sie aus (7.4.7) 
und (7.4.11): 
Rn 
_—1 
12; (n) — 9;| < B;(n) — b,(n) < (1 — 516)" 
Damit haben wir den Satz 7.4.1 vollständig bewiesen. 


E. Jetzt wollen wir zeigen, wie man die Grenzwahrscheinlichkeiten »,; berechnet, 
falls sie existieren. Aus der Formel (7.3.3) ergibt sich 


Pu; (r) =2 Pir(R — 1) Pri- 
-1 


Existieren die Grenzwahrscheinlichkeiten p,, so erhalten wir, wenn wir auf 
beiden Seiten der letzten Gleichung für 2 —oo zur Grenze übergehen, das Glei- 
chungssystem 


Ss 
2; = 2 Dr Di; G=12,...,8). (7.4.13) 
i k=1 5 


Aus diesen Gleichungen und der Beziehung 
sg 
Z2mp—1 
1 5 


kann man die gesuchten Wahrscheinlichkeiten 9, bestimmen. 


Beispiel 7.4.5. Wir kehren zum Beispiel 7.4.3 zurück und berechnen die Grenzwahrschein- 
lichkeiten 9,. Die Formel (7.4.13) ergibt drei lineare Gleichungen 


Pı = Pı9 + 229; 
Pa = PıP + 239; 
293 = P2P 7 P3P. 


Daraus erhalten wir 
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Aus der Beziehung 9, +73 + 2, = 1 erhalten wir 


ee) Bil-: 


1 1 
Für p=4g9= = ist 1 =mp=9 = 2 Dann sind im Limes alle Zustände gleich wahr- 


scheinlich. Ist aber p #g, so erhalten wir 


I 
q PT R 
pP = FIT TENg (2) (G=1,2,3). 
(2) q 
1.2. 
\q 


Wenn p>g ist, wachsen die Wahrscheinlichkeiten p; mit wachsendem j, während für 
q>»p das entgegengesetzte Verhalten auftritt. Diese Ergebnisse stimmen mit der An- 


schauung überein. So ist z.B. für Din 2 
g 


Tv 3 4 
A=7 P2ı= 7 Pp= 7 
1 
während wir für — = = 
4 2 1 
= PR= mM=7 


erhalten. Wir sehen, daß alle drei Grenzwahrscheinlichkeiten positiv sind. Das hängt damit 
zusammen, daß sie wesentlich sind (bei einer Kette mit abzählbar vielen ZUSENGEn braucht 
das nicht der Fall zu sein; vgl. auch Aufgabe 7.6.9). 


Beispiel 7.4.6. Wir wollen die Grenzwahrscheinlichkeit p; des Eep 7.4.4 berechnen. 
Aus (7.4.13) erhalten wir 
P=Pıt 929 
Pa = P3Q; 
Ps= (Pe + Po)P. 


Daraus und aus der Beziehung 9, +9, +9, =1 folgt »Bı=-1lMm=Pp 0. 
Wie wir schon vorhin erwähnt haben, liegt das daran, daß die Zustände E, und Z, vorüber- 
gehend sind. 


Den Begriff der Ergodizität und die Bedingungen für die Gültigkeit des Ergoden- 
satzes für inhomogene Markoffsche Ketten findet man in den Arbeiten von 
KOLMOGOROFF [3], SARYMSAKOW [1] und Hasnar [1], [2]. 


F. Wir betrachten jetzt die Beziehungen, die zwischen den Grenzwahrscheinlich- 
keiten und den totalen Wahrscheinlichkeiten in einer homogenen Markoffschen 
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Kette bestehen. Wir berechnen die totale Währscheinlichkeit dafür, daß sich das 
System nach » Übergängen im Zustand E, befindet. Diese Wahrscheinlichkeit 
wollen wir mit c,(n) bezeichnen. Es ist 


(n) = rn Prj(R) = 2% (nr — 1) Du; (7.4.14) 


wobei P(E,) die Wahrscheinlichkeit dafür ist, daß sich das System zu Beginn im 
Zustand E, befindet. 


Definition 7.4.5. Wir nennen eine homogene Markoffsche Kette stationär, 
wenn die Gleichungen 


P(E)=c;(l) G=12,...) 


erfüllt sind. Die c,;(n) heißen dann stationäre totale Wahrscheinlichkeiten. 


Aus den letzten Gleichungen folgen für j=1,2,... und nr =1,2,3,... die 
Gleichungen 


sl)=5l2) = =e;en) = 0;. 
Aus der Formel (7.4.14) erhalten wir also 


= 2% Pk G=12,...). (7.4.15) 
k 


Wir nehmen nun an, daß die Anzahl der Zustände endlich und gleich s ist 
und daß die Voraussetzungen des Satzes 7.4.1 erfüllt sind; die Grenzwahrscheinlich- 
keiten p, existieren also. Wie man leicht erkennt [man vergleiche nur die Formeln 
(7.4.13) und (7.4.15) miteinander], bestehen dann die Gleichungen ,;=p; 
G=1,2,...,s). Wenn die Anfangswahrscheinlichkeiten P (E,) gleich den Grenz- 
wahrscheinlichkeiten »; sind, dann sind die totalen Wahrscheinlichkeiten c,(r) 
konstant, und zwar gleich p,. Die Kette ist also stationär, und es herrscht Gleich- 
gewicht in dem Sinne, daß die Verteilung der totalen Wahrscheinlichkeiten kon- 
stant ist. Daraus erklärt sich die Bezeichnung Ergodensatz. 

Wir bemerken noch, daß für eine beliebige Markoffsche Kette mit endlich 
vielen Zuständen der folgende Satz über die Grenzwerte der totalen Wahrschein- 
lichkeiten gilt: - 

Satz 7.4.2. Dafür, daß in einer homogenen Markoffschen Kette mit endlich 
vielen Zuständen die Grenzwerte der totalen Wahrscheinlichkeiten 


lim e;(n) = 6; (=12,...,s) (7.4.16) 
existieren und von der Anfangsverteilung unabhängig sind, ist die Existenz der 
ergodischen Wahrscheinlichkeiten p; notwendig und hinreichend; dabei ist = pP; 
G=1,2,...,8). 
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Beweis. Es sei die Beziehung (7.4.16) erfüllt, und c, sei von der Anfangs- 
verteilung unabhängig. Wir können also als Anfangsverteilung P(E;) =1 und 
P(E,)=0(j =+i) wählen. Die Formel (7.4.14) ergibt dann 

cn) = Pi(n), 
und wenn wir noch (7.4.16) berücksichtigen, erhalten wir 


p; = lim p;;(n) = eo; @j=1,2,...,8). 


Nn>X 


Jetzt setzen wir voraus, daß die ergodischen Wahrscheinlichkeiten 9, existieren. 
Für eine beliebige Anfangsverteilung erhalten wir dann aus (7.4.14) 


lim c;(n) = lim I P(By) p4(n) = m PiE) =»; 
= 


NO na>0 k-1 


was zu beweisen war. 


7.5. Zufallsvariable, die eine homogene Markofische Kette bilden. 


A. Die Überlegungen der vorhergehenden Paragraphen lassen sich auf Zufalls- 
variable übertragen. Esseien X, (k = 0,1, 2,...) Zufallsvariable, von denen jede 
die Werte 2; @ =1,2,3,...) annehmen kann. Die Werte x; entsprechen den Zu- 
ständen E,, von denen bisher die Rede war. Wir bringen jetzt Definitionen, die 
den Definitionen aus 7.2 analog sind. 

Definition 7.5.1. Wir sagen, daß eine Folge {X,} (k =0,1,2,...) von Zufalls- 
variablen mit den möglichen Zuständen x»; ( =1,2,3,...) eine Markoffsche 
Kette bildet, wenn für 2,5,k =1, 2,83, ... die Gleichungen 


D=-PX = 2X = 2%) (7.5.1) 
= P(X, = % | Xu, =%, Ay, = Ze X= %n Xo =%,) 


für beliebige ®,, „---» %i, X, gelten. 


Definition 7.5.2. Wir sagen, daß eine Folge {X,} (k = 0,1, 2,...) von Zufalls- 
variablen eine homogene Markoffsche Kette bildet, wenn für i,5,k=1,2,3,... 
die bedingten Wahrscheinlichkeiten p® von k unabhängig sind: 


PD = (7.5.2) 


In die Redeweise der Zufallsvariablen übersetzt, ist die Übergangswahrschein- 
lichkeit 9,;(n) die Wahrscheinlichkeit dafür, dad X, =x; ist, wenn X, =% 
war, also 


Pl) = PR = = N). 
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Die Formel (7.3.3) hat hier die Gestalt 


Bun) = UP In =, =) PX, = 2, | Km =); (7.5.3) 


T 


wobei 1£m<n ist. 
Die durch (7.4.14) bestimmten totalen Wahrscheinlichkeiten c,;(n) haben hier 
die Form 


sm)=PR,=m)=-IPK=-)P=-2|,=m). (154) 


Die Definition 7.4.5 nimmt die folgende Gestalt an: 


Definition 7.5.3. Eine Folge von Zufallsvariablen X, (k=0,1,...), die 
eine homogene Markoffsche Kette bilden, heißt stationär, wenn für j = 1,2,3 
die Gleichungen 


ser 


50) = P,=2)=PXK,=)=gl)=o, 
gelten. 


Aus der letzten Gleichung folgt, daß für k=0,1,2,... und j=1,2,3,... 
die Gleichungen 


P(%, =z;) =6 


erfüllt sind. In einer stationären Folge von Zufallsvariablen haben also alle 
Zufallsvariablen die gleishe Verteilung. 

Ebenso leicht lassen sich die Klassifikation der Zustände und der oben be- 
wiesene Batz in der Sprache der Zufallsvariablen formulieren. Das überlassen 
wir jedoch dem Leser. 


B. Es muß gezeigt werden, daß die Theorie der Grenzverteilungen für Zufalls- 
variable, die eine homogene Markofische Kette bilden, wesentlich weniger ent- 
wickelt ist als die gleiche Theorie für unabhängige Zufallsvariable. 

Die Bedingungen für die Gültigkeit des zentralen Grenzwertsatzes für Markoff- 
sche Ketten mit drei Zuständen wurden von MARkoFF [3] gefunden; für Ketten 
mit einer beliebigen endlichen Anzahl von Zuständen wurden diese Bedingungen 
von RoMAnowszxy [1], Fr£cker [2], Onıoesov und Misoc [1], [2] angegeben. 
DOEBLIN [2] zeigte, daß für gewisse Klassen von Markoffschen Ketten mit einer 
abzäklbaren Menge von Zuständen die Frage der Grenzwertsätze sich auf die 
entsprechende Frage für unabhängige Zufallsvariable zurückführen läßt. Für 
Ketten mit beliebig vielen Zuständen wurden gewisse Ergebnisse von DoEBLIN 
[3], Doos [5], Dywkıy [2] und Cause [2], [3] erzielt. Ein verhältnismäßig weit- 
reichendes Ergebnis, das im wesentlichen eine Verallgemeinerung des Satzes von 
LINDEBERG-LEVY für eine umfangreiche Klasse von Zufallsvariablen darstellt, 
die eine homogene Markoffsche Kette bilden, wurde kürzlich von NAcaszw [1] 
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gewonnen. Ein lokaler Grenzwertsatz für Markoffische Ketten mit endlich vielen 
Zuständen wurde von KoLMOGoROFF [13] angegeben. SIRASHDINow [1] erzielte 
gewisse Ergebnisse über das Konvergenzverhalten bezüglich der Grenzverteilung 
im lokalen und integralen. Grenzwertsatz für Markoffsche Ketten mit endlich 
vielen Zuständen. In der genannten Arbeit entwickelt NAGAJEw den zentralen 
lokalen Grenzwertsatz für Markoffsche Ketten mit abzählbar vielen Zuständen 
und schätzt die Konvergenz gegen die Normalverteilung ab. 

Gewisse Sätze bezüglich des Gesetzes der großen Zahlen für Zufallsvariable, 
die eine Markoffsche Kette bilden, findet man in dem Buch von Doosg [5] und in 
der Arbeit von Cuune [3]. Allgemeine Ergebnisse auf diesem Gebiet fand kürzlich 
BREIMAN [2]. i 

Wir wollen uns hier damit begnügen, das Gesetz der großen Zahlen und den 
zentralen Grenzwertsatz für Zufallsvariable, die eine homogene Markoffsche 
Kette mit endlich vielen Zuständen bilden, ohne Beweis anzugeben. 


Satz 7.5.1. Essei ({X,}(k = 0,1, 2, ....) eine stationäre Folge von Zufallsvariablen, 
die eine homogene Markoffsche Kette mit endlich vielen Zuständen bilden. Sind alle 
wesentlichen Zustände nichiperiodisch und bilden sie eine einzige Klasse, dann be-' 
steht die Beziehung - 


pP (1m ge 2%) > | (7.5.5) 


n>o N 1 k=0 


Sind also die Voraussetzungen dieses Satzes erfüllt, so gilt für die Folge {X,} 
das starke Gesetz der großen Zahlen. Der Leser vergleiche diesen Satz mit dem 
Satz 6.12.3 von KOLMOGOROFF. 


Beispiel 7.5.1. Wir betrachten eine stationäre Folge {X,} von Zufallsvariablen mit einer 
Zweipunktverteilung, die eine homogene Markoffsche Kette bilden. Dem Zustand E, ordnen 
wir die Zahl x, und dem Zustand E, die Zahl x, zu. 

- Die Übergangsmatrix hat die Form 


Me WB ) 
Paı Pa2 


wobei 0O< 25 <1,0<Pı<1 ist. Die Voraussetzung des Satzes 7.4.1 ist hier schon für: 
r=1 erfüllt. Beide Zustände sind wesentlich und nichtperiodisch und bilden nur eine einzige 
Klasse. "Aus der Formel (7.4.13) und der Beziehung p, + ?, = 1 finden wir für die ergodischen 
Wahrscheinlichkeiten 


we Pa 
z Pı2 + Paı 
Pıa 
Dam —- 5 (7.5.6) 
: Pıa + Paı 


dabei it 0< 9, <1,0<9,< 1. Ausder Voraussetzung, daß die Folge {X} stationär ist, 
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folgt PX, =o)=p9, und PX, =%)=p (k=0,1,2,...). Nach dem Satz 7.5.1 gilt 
mit der Wahrscheinlichkeit Eins die Beziehung ü 


2 z Pa Pı2 
lim X, = ———— nu +- 
no n+1 e2 Pı2 + Paı e Pıa + Paı 


%.. (7.5.7) 


Insbesondere sei x; = 1 und x, = 0. Das Ereignis Iu- m| besteht dann darin, daß 


sich das System bei » + 1 Versuchen m-mal im Zustand. FR befindet, und die Relation (7.5.7) 
besagt: Mit der Wahrscheinlichkeit Eins konvergiert dag arithmetische. Mittel der Anzahl 


Pzı 


212 + Pıı 
Erscheinen des Wertes x, = 1 als Erfolg bezeichnen, so sehen wir, daß für die Anzahl der 
Erfolge in einer homogenen stationären Markoffschen Kette das starke Gesetz der großen 
Zahlen gilt. Für dieses Schema hatte schon MArkorrF [1] das schwache Gesetz der großen 
Zahlen erhalten. 


Wir formulieren jetzt den oben erwähnten Grenzwertsatz. Dazu setzen wir 


Male, in denen sich das System im Zustand Z, befindet, gegen : Wenn wir also das 


— FIX, — iX]. 
k=0 


Satz 7.5.2. Die Zufallsvariable X, (k =0,1,2,...) mögen eine homogene Mar- 
koffsche Kette mit endlich vielen Zuständen bilden. Sind alle Zustände wesentlich, 
bilden sie nur eine einzige Klasse und erfüllt die Dispersion D®(Y,) die Bedingung 


2 
lim DAT) (Fr) 


n>oo WR 


=>0, (7.5.8) 


so ist unabhängig von der Anfangsverteilung der Zufallsvariablen X, die Beziehung 


Y 

_£ 
lim P Y <yi = de e ?2dy (7.5.9) 
n—00 oYn +1 Y2r 


ae 


erfüllt. 


Beispiel 7.5.2. Wir kehren zum Beispiel 7.5.1 zurück. Dort betrachteten wir die statio- 
näre Folge (X,}. Essei x, =1 und z,=0. Wirsetzen Z,= X, — E(X,). Wegen der Sta- 
tionarität ist Z(X,) = P, (k= 0,1,2,...). Wir wollen D2(Y,) berechnen und nachprüfen, 
ob die Beziehung (7.5.8) erfüllt ist. Wenn wir wieder ne, daß die Folge {X} 
stationär ist, so erhalten wir \ 


n n—1 n 
D(Y)=% DZ) +2% 3 EiZrZu) (7.5.10) 
k=0 k=0 m=k-+l 


= +)mm +2 > EZ, Zn) 


k=0 m=k+1 


r 
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Um E(Z,Z,,) zu berechnen, beachten wir, daß die Zufallsvariable Z,Z,, die folgenden Werte 
mit den entsprechenden Wahrscheinlichkeiten annehmen kann: 


P(4Zm = - Pi) = PX=1) PX, = 1X, = 1)= ppm —h); 
P(Z,Zm = (1-93) (—-Ppı)) = PX, = 1) PX,=01X, = 1) 
+PX,=)PX„=1[X,= 0) 
= PıPı2(m — k) + Pep, (m — k); 
P(Z,Zm = pi) = P(X, = 0) PX = 0X, = 0) = PeP22(m — |). 
Durch einfache Umformungen erhalten wir damit 
E (2,2) = PıPspu (m — k) — PP, Palm — k) — Pıplpe, (m — k) + PRPapa (m — k) 
= PıPa[lPpı,(m — k) — Pzılm — k)] = PıPpa(Par — Pa)" TH. (7.5.11) 


Wenn wir die Bezeiohnung ö = Pıı — Pa, einführen, erhalten wir aus der letzten Beziehung 
und aus (7.5.10) 


D’(Y,) = pP[R +1+2fnö+ Rn — 1) +--+ or] 


N n—1 
= PıPa P+1+2(&5 + Nit-+ )| 


j=1 j-1 


44 26n 252(1 — ö%) 
— N 1 — 
PıPa 1-3 (19% 
Daraus folgt 
D(Y,) ( 6 on Pıp, 281 — Sr) 
= 1 2 —— — i 
a ea) ae us 


Schließlich erhalten wir, wenn wir berücksichtigen, daß O0<ö<1 ist, 


D:(Y,) 1+6ö 
Tage >. 


lim 
no nt 1 


Die Bedingung (7.5.8) ist also erfüllt, und es gilt die Beziehung (7.5.9). 

Die exakten Verteilungen der Anzahl erfolgreicher Versuche in homogenen Markoffschen 
Ketten mit zwei Zuständen, die wir in diesem Beispiel betrachtet hatten, und die Momente 
dieser Zufallsvariablen, wurden von GABRIEL [1} untersucht. In dieser Arbeit findet der Leser 
auch eine Anwendung einer solchen Kette auf Probleme der Meteorologie. 

Wir bemerken noch, daß aus (7.5.11) folgt, daß der Korrelationskoeffizient o,,, der Zufalls- 
variablen X, und X,, durch 


%km = (Pr — Pa)" F 


gegeben wird. 


Das hier betrachtete Beispiel für die Gültigkeit des zentralen Grenzwertsatzes 
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stellt einen Spezialfall eines Satzes von MARKOFF [3] dar. Der Satz von MARKOFF 
gilt für Zufallsvariable, die eine inhomogene Markoffsche Kette bilden. Der 
Markofische Satz wurde von BERNSTEIN [3] verschärft. Ein wichtiges Ergebnis 
in diesem Problemkreis erhielt DosBRuscHix [3]. 

Wir verweisen den Leser auf neuere Arbeiten von Hvxrt [1], Doos [10] sowie 
KEmeny und Sneur [2], [3], in denen neue Methoden zur Untersuchung von 
Markoffschen Ketten entwickelt werden; diese Methoden beruhen auf einer Ver- 
bindung zwischen den Markoffschen Ketten und der Potentialtheorie. 


7.6. Aufgaben und Ergänzungen 


1. Die Übergangsmatrix einer homogenen Markoffschen Kette mit vier Zuständen habe 


die Form 
1 1 1 
RE u 
4 2 4 
re 7 
15 33 
M, = 
2 1 
0 — — 0 
33 
iı 171 
“44 4] 


a) Man klassifiziere die Zustände. 
b) Man stelle fest, ob der Ergodensatz gilt. 
'c) Gilt der Ergodensatz, so bestimme man die ergodischen Wahrscheinlichkeiten. 


» 


. Man beantworte die oben angegebenen Fragen für die Matrix 


1 2 
— 00 
3 8 
3.1.1 
wen 
M, = 
- 
2-2 
Imre 
33 


3. (Das Modell von EuREnFrest). In der Physik, bei Problemen der Diffusion sowie der 
Periodizität und Reversibilität (eingehende Informationen hierüber findet man in dem 
interessanten Buch von Kac [3]) findet das folgende Modell einer homogenen Markoff- 
schen Kette Anwendung: 2R, mit den Nummern 1,2,...,2R — 1,2R versehene Kugeln 
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sind in zwei Urnen, A und B, untergebracht. In jeder Zeiteinheit wird zufällig die Nummer 
einer Kugel gezogen, und zwar entsprechend dem Polynomialschema mit der konstanten 
Wahrscheinlichkeit (2R)-!, eine der Zahlen 1,2,...,2R zu ziehen. Sobald die Nummer 
einer Kugel gezogen wurde, geht die Kugel aus der Urne, in der sie sich während des 
Ziehungsvorganges befand, in die andere Urne über. Wir wollen sagen, daß das System 
der beiden Urnen sich in dem Zustand 2,6 =0,1,...,2R) befindet, wenn die Urne A 
7 Kugeln enthält. Damit haben wir eine homogene Markoffsche Kette mit 2R +1 Zustän- 
den und der Übergangsmatrix 


0 1 () f) ) ...00 

(@R)10 1-(@R)10 N) ... 00 
 E 2(2R)-1 0 1- 2(2R)-1 0 .. 00 
5 f) f) sarı 0 1 — 3(2R)...0 0 
N) f) f) 0 f) .. 10 


a) Man zeige, daß die ergodischen Wahrscheinlichkeiten p, (a) existieren; sie sind demnach 
den stationären Wahrscheinlichkeiten c, gleich, und es ist dabei 


2R\ 1 , 
G= ; zen (G=0,1,...,2R). 


b) Man beweise, daß unabhängig vom Anfangszustand des Systems sich im Grenzfall 
stets die Binomialverteilung ergibt. - 

c) Unter Verwendung der Aufgabe 5.14.2 stelle man fest, weleher Zustand im Grenzfall 
der wahrscheinlichste ist. 


4. a) Man zeige, daß für jede homogene Markoffsche Kette mit endlich vielen Zuständen der 
Grenzwert 


1a 
lim — 8 9,(k) = 95 


n>o ® ki 


existiert. 
b) Man berechne q;,; in den Beispielen 7.4.1 bis 7.4.4. 


5. (Fortsetzung der Kolmogoroffschen [9] Klassifizierung der Zustände). Es möge K,,(n) 
die Übergangswahrscheinlichkeit vom Zustand E, in den Zustand E, zum ersten Mal auf 
dem n-ten Schritt bedeuten, und es sei 


5 x oo 
I;3= 3 Kun), Ry= N nKyfn). 
n=1 n=1 


Den Ausdruck R,; nennt man die mittlere Rückkehrzeit des Zustandes E;. 

Man nennt den Zustand #; rekurrent, wenn Ly =1 ist, und iransient, wenn LI; <i ist, 
Ein rekurrenter Zustand, für den R,,; = oo ist, heißt Nullzustand. Ein rekurrenter Zu- 
stand, der weder periodisch noch ein Nullzustand ist, wird als ergodischer Zustand be- 
zeichnet, 
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Man beweise die folgenden Behauptungen: 

a) Kyln) = pn) — Kyll) Pla — 1) —— Kun — 125. 

b) In einer homogenen Markoffschen Kette mit endlich vielen Zuständen ist der Zustand 
E; dann und nur dann rekürrent (transient), wenn er wesentlich (unwesentlich) ist. 


‚ Wir betrachten eine homogene Markoffsche Kette mit abzählbar vielen Zuständen und 


der Übergangsmatrix 


»p, 1-20 0 0... 
0 1— 0 0.. 

M, = Pa Pr 
2; 0 0 1-99... 


j=1 ; 
so sind alle Zustände rekurrent. 
Man vergleiche dieses Ergebnis mit der Aufgabe 5b und folgere hieraus, daß Zustände 


existieren können, die sowohl transient als auch wesentlich sind. 


oo oo 
Man beweise: Ist I) 2, <, so sind alle Zustände transient, ist jedoch 25 =R, 
=1 


. Wir bezeichnen mit Q;, die Wahrscheinlichkeit dafür, daß ein System unendlich oft in 


den Zustand E, zurückkehrt, wenn es den Zustand E, als Ausgangszustand hatte. Man 

beweise die folgenden Behauptungen: 

a) Ist 2, =1, soist Q, = 1. 

b) In einer Menge wesentlicher Zustände, die eine Klasse bilden, sind entweder alle 
25; <1 oderalle 9, =1. 


. Man beweise, daß in einer Menge von wesentlichen Zuständen, die eine Klasse bilden, 


entweder alle Z;< 1 oderalle Z,=1 sind, 


. (Verallgemeinerung des Ergodensatzes.) Es sei M, = (9,5) die Übergangsmatrix einer 


homogenen Markoffschen Kette mit abzählbar vielen Zuständen E,, E,, ... Man beweise, 
daß dann die folgenden Behauptungen gelten: 


a) Sind alle Zustände rekurrent, keine Nullzustände und nichtperiodisch und bilden 
sie eine Klasse, so gilt für %,57 =1,2,... 


1 
lim 2,(n) = 9; = — 
N 4 ö $,; ; 
mit 9, +92 + = 1, wobei 2,> 0 und P; = c; ist; dabei ist 2) die stationäre Wahr- 
scheinlichkeit. 
b) Ist der Zustand E, ein transienter oder rekurrenter Nullzustand, so ist lim p;,(r) = 0. 
2-09 
e) Ist der Zustand E, ein rekurrenter periodischer Nullzustand mit der Periode d> 1, 
so gilt 
li (n) z 
ım Pi n)= — 
no 7 BR; 


(KoLMoGoRoFF [9], FELLER [7]). 
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10. Wir betrachten eine homogene Markoffsche Kette mit abzählbar vielen Zuständen und 
der Übergangsmatrix 


ii 
— —000%0 
2 
2 1 
—0-—- 00% 
3 3 
M,=|3 1 
— 00 -0%0 
4 4 
4 1 
—0009 — 0 
5 5 


1 
Man zeige, daß dann lim p,(a)=p; = — (‚5=1,2,...) gilt. Man vergleiche hierzu 
Aufgabe 6. MER ” 
11. Wir betrachten eine homogene Markoffsche Kette mit abzählbar vielen Zuständen und 
der Übergangsmatrix 


——0000 

2 2 

Io 000 
2 2 
M=|1i 2 

—- 090-—-0%0 

3 3 

1 3 

— 000-0 

4 4 


Man beweise, daß sämtliche Zustände rekurrente Nullzustände sind und somit 


lim 2, (n) = 0 j=12 ...) 
oo 


nn 


gilt. 


8. STOCHASTISCHE PROZESSE 


81. Der Begriff des stochastischen Prozesses 


In dıesem Kapitel wollen wir den bisherigen Bereich der Wahrscheinlichkeits- 
rechnung erweitern. Diese Erweiterung erfolgt in zwei Richtungen. Wir werden 
nicht nur wie bisher Folgen von Zufallsvariablen betrachten, d.h. nur endliche 
oder abzählbare Mengen von Zufallsvariablen, sondern auch überabzählbare 
Mengen von Zufallsvariablen. Um die zweite Ausdehnung unseres Bereiches 
klar darstellen zu können, müssen wir noch einige einleitende Bemerkungen 
machen. 

Wir haben in den vorangegangenen Kapiteln Zufailsvariable betrachtet, die 
jedem Elementarereignis ein n-Tupel von Zahlen zuordneten. Mit anderen 
Worten: Die Realisierung dieser Zufallsvariablen ist ein n-Tupel von Zahlen. 
Auch eine Folge von Zufallsvariablen &,, X, X, ... kann man als eine einzige 
Zufallsvariable auffassen. Ihre Realisierung ist dann die Zahlenfolge (x,, £, &, ...) 

In der Praxis treffen wir aber noch viel kompliziertere, vom Zufall abhängige 
Vorgänge an, deren Realisierungen reelle Funktionen sein können. So ist z.B. 
die Anzahl der Telefongespräche in Warschau während des Zeitabschnitts (0, t) 
für festes i eine Zufallsvariable, während die Anzahl der Gespräche, als Funktion 
von $ betrachtet (wobei t irgendein Intervall durchläuft), eine Zufallsfunktion ist. 

Der Verbrauch an elektrischer Energie in Warschau zu einem gegebenen 
Zeitpunkt ist eine Zufallsvariable, dagegen ist der Energieverbrauch während 
einer längeren Zeit, als Funktion der Zeit betrachtet, eine Zufallsfunktion. 

Ebenso. ist der Wasserstand der Weichsel unter der Poniatowski-Brücke in 
Warschau, gemessen täglich in einem bestimmten Augenblick, eine Zufallsvariable- 
während der Wasserstand der Weichsel, der täglich in einem bestimmten Augen, 
blick im Abstand t von der Poniatowski-Brücke gemessen wird, als Funktion 
von t betrachtet, eine Zufallsfunktion ist. 

Während die eine Erweiterung der Wahrscheinlichkeitsrechnung darin be- 
stehen wird, daß wir jetzt auch nichtabzählbare Mengen von Zufallsvariablen 
betrachten, besteht die andere in der Untersuchung von Zufallsfunktionen. Die 
so erweiterte Wahrscheinlichkeitsrechnung nennt man T'heorie der siochastischen. 
Prozesse. 


Definition 8.1.1. Wir nennen eine Menge von Zufallsvariablen X,, die von 
einem Parameter f abhängen, der in einer. gewissen reellen Zahlenmenge I 
variiert, einen stochastischen Prozeß. 


8.2. Markofische Prozesse und Prozesse mit unabhängigen Zuwächsen 321 


Einen stochastischen Prozeß wollen wir mit {X,,t € I} bezeichnen. Den Para- 
meter i wollen wir die Zeit nennen. j 

Im Sinne dieser Definition ist eine k-dimensionale (k > 1) Zufallsvariable 
ein stochastischer Prozeß, I ist hier die Menge (1, 2,..., k). Auch jede abzählbare 
Folge {X,} (k=1,2,...) von Zufallsvariablen ist ein stochastischer Prozeß; 
hier ist I die Menge aller natürlichen Zahlen. In diesen beiden Fällen sprechen wir 
von Prozessen mit diskreter Zeit. Eine wirkliche Erweiterung der Wahrscheinlich- 
keitsrechnung liegt aber erst dann vor, wenn J eine nichtabzählbare Menge ist. 
. Dabei wollen wir uns auf den Fall beschränken, daß / ein endliches oder un- 
endliches Intervall ist. Wir sprechen dann von einem stochastischen Prozeß mit 
stetiger Zeit. 

Wir bemerken nur, daß man einen stochastischen Prozeß auch noch anders 

definieren kann. Man kann nämlich einen stochastischen Prozeß als eine Menge 
von Zufallsfunktionen auffassen, die den Elementarereignissen zugeordnet 
wurden. Hier begnügen wir uns damit, darauf hinzuweisen, daß X, für festes t 
eine Zufalisvariable ist, während für festgewählte Elementarereignisse die Größe 
X, eine Zufallsfunktion des Arguments # ist; diese Funktion wollen wir eine 
Realisierung des stochastischen Prozesses nennen. 
“ Bei vielen Problemen ‘aus der Theorie der stochastischen Prozesse bedeutet 
der Parameter t tatsächlich die Zeit, in der die untersuchte Erscheinung abläuft. 
Der Parameter £ kann aber auch irgendeine andere physikalische Größe be- 
zeichnen, z. B. den Raum, in dem der Prozeß verläuft, oder er braucht überhaupt 
keinen physikalischen Sinn zu haben. 


82. Markoffsche Prozesse und Prozesse mit unabhängigen Zuwächsen 


A. Wie wir schon im vorigen Kapitel bemerkten, entsteht die Notwendigkei*, 
sich mit abhängigen Zufallsvariablen zu beschäftigen, durch die Bedürfnisse der 
Physik und der Technik. Jetzt, da wir zur Untersuchung von nichtabzählbaren 
Mengen von Zufallsvariablen übergehen, müssen wir uns von vornherein mit ab- 
hängigen Zufallsvariablen beschäftigen. Setzen wir nämlich voraus, daß die 
Zufallsvariablen unabhängig sind, so können wir, wenn es überabzählbar viele 
sind, schwerlich erwarten, eine Gesetzmäßigkeit in diesem Chaos von zufälligen 
Ereignissen zu finden; andererseits ist die Untersuchung der Gesetzmäßigkeiten, 
die bei zufälligen Ereignissen auftreten, die Hauptaufgabe der Wahrseheinlichkeits- 
rechnung. 

Wir wollen nun Definitionen von verschiedenen stochastischen Prozessen 
bringen und mit der Definition eines Markoffschen Prozesses beginnen. Diese 
Prozesse spielen eine große Rolle in der Theorie und den Anwendungen. 


Definition 8.2.1. Einen stochastischen Prozeß {X,,t€ I} bezeichnen wir 
als Markoffschen Prozeß, wenn für n=1,2,3,... und beliebige Parameterwerte 
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meIm=0,1,...,n;i,<ti<'-<t,) sowie £ür beliebige reelle Zahlen y, x 
die Gleichung 


Seth, Ey = 24) 


3 


PEN eu 
= P(X,<ylX,,=2) (8.2.1) 


für alle 2... -..,%0 gilt. 

Gemäß dieser Definition hängt die bedingte Verteilung der Zufallsvariablen 
X,, unter der Bedingung, daß die Zufallsvariable X,, , den Wert x annimmt, von 
keiner Information über die Werte ab, die durch die Zufallsvariablen dieses 
Prozesses in den t,., vorausgehenden Zeitpunkten angenummen werden. Für 


> 
zwei beliebige Parameterwerte 4, EI! und EI mü f, <i, definieren wir die 
bedingte Verteilungsfunktion F(t,, 2, t,, y) dureh dis Fon.uel 


Fit y)=PR,<ylX,=e). (8.2.2) 


Diese Verteilungsfunktion ist von dem Wert von X, zura Zeitpunkt 1 <d, un- 
abhängig. 

Mit den Eigenschaften der durch diese Formel bestimmten . Verteilungs- 
funktionen wollen wir uns in 8.8 näher beschäftigen. 


Definition 8.2.2. Ein Markoffischer Prozeß {X,teT; ist homogen, wenn 
für beliebige i, ce Zundt,E/! (it, <t,) die Verteilungsfunktion (8.2.2) nur von 
der Differenz t=t1, — I, abhängt. Wir schreiben in diesem Fall 


FÜ, %, 79 4) 7 Fi, %, Y). (8.2.3) 


Die Prozesse, von denen in den beiden foigenden Definitionen die Rede ist 
5 ’ 
haben große praktische und theoretische Bedeutung. 


Definition 8.2.3. Wir sagen, daß {X,tET) ein Prozeß mit unabhängigen 
Zuwächsen ist, wenn für n =2,3,... und beliebige EI (m=6,1,...,n; 
u <h <<) die Zufellsvariablen X, — I, I, — Xp. , X, — X, ım- 
abhängig sind. 

Erfüllt ein Prozeß {X,,t€ I} mit unabhängigen Zuwächsen die Bedingung 
P(X,=5) =1, wohei i, der Anfangszeitpunkt und 5 eine Konstante ist, dann 
ist er ein Markoffscher Prozeß. Es gilt dann (mit der Wahrscheinlichkeit Bins) die 
Gleichung 


X,, ist also eine Summe von 2» + 1 unabhängigen Zufallsvariablen. 
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Andererseits braucht aber ein Markoffscher Prozeß kein Prozeß mit unabhängi- 
gen Zuwächsen zu sein. In der Tat, es sei P(X, =0) =1, und 


beten 
sei ein Markoffscher Prozeß. Für Werte t, und t,, die den Ungleichungen 


h<h<u<e 


genügen, erhalten wir dann 


PR, =, = +tn)=- PA, =, I, —- X, =%) 
= P(X, = x) P(X, = X, == %|X,, = %)- 
Nehmen wir an, der betrachtete Prozeß habe unabhängige Zuwächse. Dann wäre 


PR, =, 4,-%,=9)=P(X,=n)PX,—-X,=®). 


Die rechten Seiten der letzten und der vorletzten Gleichung brauchen aber nicht 
gleich zu sein. 


Definition 8.2.4. Der Prozeß {X,,t€ I} erfährt homogene Zuwächse, wenn 
für beliebige &,%,€ I (1, <t,) die Wahrscheinlichkeitsverteilung der Zufalls- 
variablen X,, — X, nur von t=t1,— t, abhängt. 

Ein Prozeß mit unabhängigen Zuwächsen, der ein homogener Markoffscher 
Prozeß ist, ist, wie man leicht nachweisen kann, ein Prozeß mit homogenen Zu- 
wächsen. 


B. In 8.3 bis 8.7 wollen wir Markoffsche Prozesse behandeln, deren Zufalls- 
variable diskret sind, also mit der Wahrscheinlichkeit Eins endlich oder abzählbar 
viele Werte annehmen. Wir nehmen der Einfachheit halber an (diese Annahme 
ist in den Anwendungen häufig erfüllt), daß die Sprungstellen der Verteilungs- 
funktionen in ganzen Zahlen ö liegen. Wir wollen diese Zahlen Zustände oder 
Phasen nennen, während wir den Prozeß selbst als diskret bezeichnen wollen. Für 
diesen Fall ist es bequemer, den Prozeß durch die bedingte Wahrscheinlichkeits- 
funktion zu charakterisieren, anstatt wie bisher durch die bedingte Verteilungs- 
funktion. Die Definitionen 8.2.1 und 8.2.2 erfahren dann dementsprechende 
Änderungen. 


Definition 8.2.1’. Ein diskreter Prozeß {X,,tEI} heißt ein Markoffscher 
Prozeß, wenn für n=1,2,3,... und für beliebige Parameterwerte „EI 
(m =0,1,...,0; ty, <t, << t,) sowie für beliebige ganze Zahlen ;, j die Glei- 
chungen 

P(X,, —=7|X,_, = i, Pe = in-93 ...; X = %o) = P(X,„ = 3IX,,_, Bund ?) 
(8.2.4) 
für alle i,, ..., %u-g gelten. 
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Für zwei beliebige Parameterwerte EI und EI mit i,<t, definieren 
wir die Funktion der Übergangswahrscheinlichkeit durch die Formel 

Pula) = PX, =, =). (8.2.5) 


Die Funktion 9;;(h,, t) ist vom Wert des Prozesses X, zum Zeitpunkt t<i, 
unabhängig. 

Der Leser vergleiche diese Definition 8.2.1’ mit der Definition 7.2.1. 

Die Funktionen p;,(t,, t2) genügen selbstverständlich den Beziehungen 


Pl) td. i (8.2.6) 


Außerdem gelten für beliebige t,t%,€ / (fi <t,) und alle i die Gleichungen 
\ 


ZPpzlnt) 1. (8.2.7) 
; : 
. 
Die Gleichung. 
Pij (1, 12) — Pix (iu 8) Pk (8, t,), (8.2.8) f 
: k 


wobei 1, <s<1t, ist, gilt für beliebige t,, t, und s. Sie läßt sich vollkommen 
analog wie die Gleichung (7.3.3) herleiten. Die Gleichung (8.2.8) ist eine Ver- 
allgemeinerung der Markoffschen Gleichung und wird nach Cuapman und Kor- _ 
MOGOROFF benannt. 

Aus den Formeln (8.2.4), (8.2.5) und (1.5.7) erhalten wir für n=1,2,... und 
beliebige „€ I (m =0,1,...,n), wobei 4, <t, <---< t, ist, die folgende Formel 
für die Wahrscheinlichkeitsfunktion der Zufallsvariablen (X, X, ..., X,,): 


PX, ie In ins A, =) 
= P(Xı, = io) Pioi (os 61)" "Pinarin (in-1s En) (8.2.9) 


Die Wahrscheinlichkeitsfunktion der Zufallsvariablen X,, und die Übergangs- 
wahrscheinlichkeitsfunktionen bestimmen die Wahrscheinlichkeitsverteilung der 
(n + 1)-dimensionalen Zufallsvariablen (X,,X,,...,X,,) für n=1,2,3,... 
und für beliebige Parameterwerte t. 


Definition 8.2.2’. Ein diskreter Markoffseher Prozeß {X,, t € I} heißt homogen, 
wenn für beliebige ö, j sowie für beliebige tt, € I (ft, <t) die Übergangswahr- 
scheinlichkeitsfunktionen nur von der Differenz t=t,—t, abhängen. Wir 
schreiben in diesem Fall 


Pal, bo) = Pylt). (8.2.10) 
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Die Beziehungen (8.2.6) bis (8.2.8) haben dann die Form 


>, (8.2.11) 
Zu; =1, (8.2.12) 
7 

Pl + Ss) = Pu) Prj (8). (8.2.13) 


C. Die Sätze 7.4.1 und 7.4.2 kann man auf homogene Markoffsche Prozesse mit 
endlich vielen Zuständen und stetiger Zeit übertragen. Die Beweise sind im Grunde 
genommen dieselben wie für Markoffsche Ketten. Man hat nur statt des Para- 
meters n den Parameter i zu setzen. Deshalb bringen wir diese Sätze ohne Beweis. 


Satz 8.21. Es si {[X,0St< 00} ein homogener Markoffscher Prozeß mit 
endlich vielen Zuständen i = 0,1, ...,s. Gibt es ein t* ( Si* <oo) derart, daß 


P;(i*) > 0 ,j=0,1,2,...,s) 
ist, so existieren die Grenzwerte 


lim p;() =p; > 0 ,5=0,12,...,3). (8.2.14) 


t>o0 


Wir führen folgende Bezeichnung ein: 
sd=PAL=)I) G=04-:); 


c;(t) ist also die totale Wahrscheinlichkeit dafür, daß der Prozeß im Moment t 
im Zustand 7 ist. Für einen homogenen Markoffschen Prozeß besteht die Be- 
ziehung 


= 30) P5l)- (8.2.15) 
Satz 8.22. Es sei {X,0=<t<oo} ein homogener Markoffscher Prozeß mit 
endlich vielen Zuständen i =0,1,...,s. Die Grenzwerte 
imc(t)=4 G=0,1,...,s) (8.2.16) 
t->00 


existieren und sind unabhängig von der Anfangsverteilung im Augenblick = 0 
genau dann, wenn die ergodischen Wahrscheinlichkeiten p; ewistieren, die durch 
die Formeln (8.2.14) bestimmt sind. Dann it 9, =, =0,1,..., 8). 

Fucas [1] hat den Satz 8.2.2 auf homogene Markoffsche rözesse mit: beliebig 
vielen Zuständen verallgemeinert. 

Mit der weiteren Untersuchung der Eigenschaften von allgemeinen diskreten 
Markoffschen Prozessen wollen wir uns in 8.7 beschäftigen. In den nächsten 
Paragraphen behandeln wir zunächst einige wichtige Spezialfälle solcher Prozesse. 
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8.3. Der Poissonsche Prozeß 


In 5.5 behandelten wir die Poissonsche Verteilung. Dort zeigten wir, daß man die 
Poissonsche Verteilung als Grenzverteilung einer Folge von Binomialverteilungen 
erhalten kann, und in den Beispielen 5.5.1 bis 5.5.2 überzeugten wir uns von der 
guten Übereinstimmung einiger beobachteter Verteilungen mit der Poissonschen 
Verteilung. Jetzt sind wir in der Lage, diese Erscheinung eingehender zu unter- 
suchen. Diesmal gehen wir aber ariders an die Frage nach der Entstehung der 
Poissonschen Verteilung heran. Wir werden nämlich gewisse Bedingungen 
formulieren (sie stellen die mathematische Idealisierung beobachtbarer Eigen- 
schaften der untersuchten Erscheinungen dar) und zeigen, daß unter diesen Be- 
dingungen die Poissonsche Verteilung auftritt. Dieser neue Weg zur Lösung der 
Frage, wann eine Poissonsche Verteilung auftritt, kann auch bei vielen anderen 
Wahrscheinlichkeitsverteilungen eingeschlagen werden. 

Kehren wir zum Beispiel 5.5.2 zurück. Dort sprachen wir über die Emission 
von a-Teilchen durch radioaktive Substanzen. Wir wollen weiter unten die zur 
Poissonschen Verteilung führenden Bedingungen formulieren und dabei jede der 
Bedingungen an Hand dieses Beispiels interpretieren. Man kann nämlich auf 
Grund vieler Beobachtungen mit guter Annäherung annehmen, daß die Be- 
dingungen für dieses Beispiel erfüllt sind. 

Es sei X, die Anzahl der beobachteten zufälligen Ereignisse im Intervall [0, #], 
wobei 0 <t << oo ist. Wir haben hier einen stochastischen Prozeß {X,0 <t<oo} 
vor uns; dabei kann die Zufallsvariable X, für jedes ? die ganzzahligen nicht- 
negativen Werte ? =0,1,2,... annehmen. Weiter kann für beliebige t, und t, 
(, <t,) der Zuwachs X,, — X,, gleich 0,1,2,3,... sein. 

Bezeichnen wir das eben behandelte Ereignis als „Signal“, so können wir einen 
solchen Prozeß ‚Signalprozeß‘“ nennen. In konkreten Anwendungen kann es sich 
wirklich um einen Signalprozeß handeln, wie dies auch im Beispiel 8.3.1 der Fall 
ist, wo die Arbeit einer Telefonzentrale betrachtet wurde. Im hier behandelten 
Beispiel 5.5.2 wird ein „Signal“ durch die Emission eines «-Teilchens dargestellt, 
und X, bezeichnet die Anzahl der emittierten «-Teilchen während des Zeit- 
abschnitts [0, £). 

Wir setzen voraus, daß die folgenden Bedingungen erfüllt sind: 


I. Der Prozeß {X,,0 <t <.oo} hat unabhängige Zuwächse. 
Die Bedingung I besagt also, daß die Anzahlen der Signale in sich nicht über- 


schneidenden Zeitintervallen 
[io t,), It,. b,), ... [a-1: 179) 


unabhängige Zufallsvariable sind. 
In unserem Beispiel sind die Anzahlen der «-Teilchen, die während sich nicht 
überschneidender Zeitintervalle emittiert wurden, unabhängig. 


II. Der Prozeß {X,,0 <t<o0} hat homogene Zuwächse. 


8.3. Der Poissonsche Prozeß , 3237 


Bedingung II besagt also, daß die Wahrscheinlichkeit für das Auftreten einer 
bestimmten Anzahl von Signalen in Zeitintervallen gleicher Länge konstant ist. 
In dem betrachteten Beispiel ist die Wahrscheinlichkeit für die Emission 
einer bestimmten Anzahl von «-Teilchen in Intervallen gleicher Länge konstant. 
Wir führen für At >0 folgende Bezeichnung ein: 


WA) =P(X,„—- X, =i) G=0,1,2%,...). (8.3.1) 


W;(dt) ist also die Wahrscheinlichkeit dafür, daß im Intervall der Länge 41 
das betrachtete Signal ö-mal vorkommt. Wegen Bedingung II hängt diese Wahr-: 
scheinlichkeit nur von At ab. 


III. Es bestehen die Beziehungen 


ee ee 5 Ä (8.3.2) 
40 At 

lim LM) MA), (8.3.3) 
A>0 dt 


Die Beziehung (8.3.2) besagt, daß die Wahrscheinlichkeit für das Auftreten 
eines einzigen Signals in einem kleinen Intervall der Länge At gleich 4At + o{At) 
ist, während die Beziehung (8.3.3) aussagt: Die Wahrscheinlichkeit, daß wenigstens 
zwei Signale auf einmal in einem Zeitintervall der Länge At auftreten, ist von der 
Ordnung o(At). Die Bedingung III bedeutet also inhaltlich: Signale treten 
plötzlich und blitzschnell in kleinen Zeitabschnitten (asymptotisch gleich Null) 
auf, aber nur einzeln, und nicht etwa zu Paaren, Tripeln usw. Bei der betrachteten 
Emission von «-Teilchen kann man in Annäherung annehmen, daß die Bedingung 
II erfüllt ist. 

Wir bringen nun die Definition eines homogenen Poissonschen Prozesses, 


Definition 8.3.1. Ein diskreter stochastischer Prozeß {X,0St<coo} mit 
unabhängigen Zuwächsen und den Zuständen i =0,1,2,... heißt ein komogener 
Poissonscher Prozeß, wenn für einen beliebigen Punkt (0 < t <.oo) die Beziehung 


PX=i = en exp (—Ai) (8.3.4) 
23 


gilt, wobei A>O ist. 


Satz 8.3.1. Ein stochastischer Prozeß {X,0 <t<.oo}, wobei X, die Anzahl der 
Signale im Zeitabschnitt [0,t) bedeutet, der die Bedingungen I bis. III und die 
Gleichung P(X,=0) =1 erfüllt, ist ein homogener Poissonscher Prozeß. 
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Beweis. Wenn wir die Bezeichnung (8.3.1) und die Bedingungen I und II 
berücksichtigen, erhalten wir für At > 0 


Wo(t + At) = Will) W,(At), (8.3.5) 
Wit +4) = 5 W;«+lt) Wı(At) (=1,2,...). (8.3.6) 
k=0 


In der Tat, wenn im Abschnitt [0, i + At) kein einziges Signal auftritt, dann 

kann auch weder im Abschnitt [0, £) noch in [i,t-+ At) ein Signal aufgetreten 

sein, und umgekehrt. Da die Bedingung I erfüllt sein soll, erhalten wir (8.3.5). 
Tritt das Signal im Abschnitt [0, i -- At) genau i-mal auf, so kann das auf 

‘+1 verschiedene, sich paarweise ausschließende Arten geschehen: Das Signal 

kann nämlich ( — %)-mal im Intervall [O, t) und k-mal im Intervall [t, t + 41t) 

(k=0,1,...,t) auftreten. Daraus und aus Bedingung I erhalten wir (8.3.6). 
Wir wollen jetzt (8.3.2) bzw. (8.3.3) in der Form 


W,(At) =4At + o0(At) (8.3.7) 
bzw. - 


1 — W,(At) — W,(At) = 3 W,(At) = o(At) (8.3.8) 
k=2 
schreiben. Aus diesen Formeln folgt die Gleichung 
WA) =1—AAtHoldi). (8.3:9) 
Mit (8.3.9) erhalten wir aus (8.3.5) 


W,d + At) —- Wil) 
At 


o(At) 
At 


= IM) —- Wi) 


Ebenso erhalten wir aus den Formeln (8.3.7) bis (8.3.9) und (8.3.6): 


er RN ham ee Em. 


At At % 


Gehen wir in diesen Gleichungen zur Grenze für At— 0 über, so finden wir das 
lineare Differentialgleichungssystem 


Wi) = —AWt), (8.3.10) 
W;() = —AW;(t) +AW;,lt) 6-12... (8.3.11) 


Berücksichtigen wirnoch, daß W,(0) = 1 ist, so ergibt sich aus der Gleichung 
(8.3.10) sofort 


W,tt) =exp (At). | (8.3.12) 
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Um das Gleichungssystem (8.3.11) zu lösen, setzen en 

W;tt) = U;(t) exp (—At) @=0,1,2,...). (8.3.13) 
Aus (8.3.12) erhalten wir U,(t) =1. Weiter ist 

WW) = [U;(t) — AU,;(t)] exp (— At) (=1,2,...). 
Daraus und aus (8.3.11) ergibt sich 
[O; (6) — AU;()] exp (— At) = —AW; lt) — Win) 

= —A[U;(t) — U; ,{f)] exp (— At) =1,2,...). 

Die Funktionen U, (t) genügen also den Differentialgleichungen 

U(t) =AU; st) (=1,2,...). 


Wir integrieren und erhalten 
t 
U;() — U,(0) =A [ Ui,()dt =1,2,...). 
6 


Aus der Definition der Funktion U,;(f) ergibt sich U,(0) = W;(0) für alle ö. Also 
folgt aus W,(0) = 1, W,(0) =0 für >21, daß U,(0) =0 für alle «> 1 ist, 
und wir erhalten schließlich 


U; -1 [0,0 G=12,...). 
. 


Es ist also 


U;(t) - 


Daraus und aus (8.3.13) folgen die Gleichungen 
(Ab 
i 


wi) = exp (At) Gel,2,4). (8.3.14) 


Aus den Gleichungen (8.3.12) und (8.3.14) folgt, daß für einen beliebigen Punkt 
(0 <t<.oo) die folgenden Gleichungen gelten: 


Pia =) = N op (1) @=0,1,...). 


v 


Der Satz 8.3.1 ist damit bewiesen. 
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Beispiel 8.3.1. Wir betrachten die Arbeit einer Telefonzentrale, Hier verstehen ir 
unter einem Signal einfach das Signal eines Abonnenten, der eine Telefonverbindung hei- 
stellen will. Die Bedingung I ist erfüllt, die Anzahlen der Telefongespräche in verschieder en 
Zeitintervallen sind mit guter Näherung unabhängig. Die Bedingung II ist erfüllt, wenn #ir 
nur unsere Beobachtungen immer zu derselben Tageszeit anstellen, so da® die Häufigkeit 
der angemeldeten Gespräche gleich bleibt. Auch die Bedingung III ist näherungsvweise 
erfüllt. 


Der betrachtete homogene Poissonsche Prozeß ist als Prozeß mit unabhängigen 
Zuwächsen, der der Gleichung P(X, =) =1 genügt, ein homogener Markoff- 
scher Prozeß. Die Übergangswahrscheinlichkeitsfunktion p,,(f) bat die Gestalt 


PX, = %, X, == X, == 3 == ?) 
P(X, —— ?) 


By )=PX,=jX,=i: 


Ay 
Gen! 
dabeiist = —H und j>=#. Offensichtlich ist »,;(f) -0 für Ii<i. 


Aus der letzten Formel folgt, daß für einen homogenen Poissonschen Prozeß 
ein Ergodensatz gilt. Es gilt nämlich für beliebige i und 5 


=P(X,„-X,=j-0)= exp (—Al); (8.3.15) 


Iimp;)=0. (8.3.18) 
i>00 


Die Tatsache, daß alle Grenzwahrscheinlichkeiten gleich Null sind, erklärt 
sich daraus, daß alle Zustände vorübergehend sind (vgl. Aufgabe 7.6.5 und 7.8.9); 
denn von jedem Zustand © kann man zum Zustand j > i übergehen, während 
man aber aus dem Zustand j > i nicht mehr zum Zustand i zurückkehren kann. 

Aus der Formel (8.3.15) ergeben sich leicht für ? = 0,1, 2,... die Beziehungen 


g: = lim 


iD 


R > .Ö. 


i—>0 


: miexp (— 

RB er ea) 
t>0 t {0 G _ lt 

_f für Den 1, (8.3.18) 

0 für j>i+l und j<i, 

Zu =: | en 

; 

jeri 


Die Ausdrücke 9; und 9;; heißen Intensitäten des stochastischen Prozesses. 
Wie man sieht, sind die Intensitäten eines homogenen Poissonschen. Prozesses 


konstant (d.h. von t unabhängig). 


8.4. Der Furry-Yulesche Prozeß 331 


Die Realisierungen eines homogenen Poissonschen Signalprozesses werden durch 
nichtabnehmende Treppenlinien dargestellt. Dem Auftreten eines Signals im - 
Moment # entspricht ein Sprung der zufälligen Funktion um eine Einheit; dabei 
ist die Anzahl der Sprünge in jedem endlichen Intervall [0, #) endlich. Abb. 8.3.1 
stellt eine derartige Realisierung dar. 


Abb. 8.3.1 


Eigenschaften des homogenen Poissonschen Prozesses untersuchte Lävy [3]. ' 

Der Poissonsche Prozeß, seine verschiedenartigen Verallgemeinerungen und 
zahlreichen Anwendungen bildeten den Gegenstand vieler Arbeiten. Wir er- 
innern hier an die Arbeiten von CHInTscHin [2], [7], FLOREKR, MARCZEWSKI und 
RxuL-NArDzEewSskı [1], Marczewskı [1], Pr&korA [1], JAwnossy, Rfnyı und 
Aczkı [1], Rexvt [1], [2], [6], TaxAos [2], [3], Forter [3], Fısz und URrganık [1]. 
Der gleichen Problematik ist ein ganzes Kapitel im Buch von Brauc-LAPIERRE 
und Forrer [1] gewidmet. (Siehe auch die Aufgaben 8.13.1 bis 8.13.8.). 

Wir erinnern insbesondere an das kürzlich erzielte Ergebnis von Pykz [1], 
der eine Formel für die Verteilungsfunktion für die unteren und oberen Grenzen 
der Realisierung einer linearen Funktion X, — «t eines Poissonschen Prozesses 
X; in dem Intervall [0, t,) für ein beliebiges positives i, angegeben hat. 
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Trotz der vielen Anwendungen, die der Poissonsche Prozeß gefunden hat, kann 
man ihn in vielen Problemen nur als erste Näherung ansehen. Um weitere und 
bessere Näherungen zu gewinnen, muß man viel allgemeinere Modelle betrachten. 
Diese Verallgemeinerungen können in zwei Richtungen erfolgen. Die erste Ver- 
allgemeinerung besteht darin, daß die Intensität A, die durch die Formel (8.3.2) 
definiert ist, von dem Zustand, in dem sich der Prozeß befindet, abhängen kann. 
Bei der zweiten Verallgemeinerung betrachtet man Prozesse, die nicht nur das 
Auftfeten gewisser Erscheinungen, sondern auch ihr Verschwinden berücksichtigen. - 
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Jetzt beschäftigen wir uns näher mit der ersten Richtung, die zweite werden wir 
in 8.5 behandeln. 


A. Es bezeichne X, die Anzahl der nicht verschwindenden Elemente einer ge- 
wissen Menge zur Zeit t oder die Anzahl gewisser Ereignisse, die im Augenblick t 
oder früher eintraten. Dann können die Variablen X, und die Zuwächse von X, 
in einem beliebigen endlichen Intervall als Werte nur die ganzen Zahlen j = 0,1, 
2, 3,... annehmen. Der betrachtete Prozeß (X,0 <t< oo} genüge den Be- 
dingungen I und II sowie der abgeänderten Bedingung III aus 8.3. Es sollnämlich 
jetzt die durch Formel (8.3.2) definierte Größe A eine Funktion des Zustandes 5 
sein, in dem sich der Prozeß im Moment t befindet, und wir wollen A, an Stelle von 
A schreiben. Ein solcher Prozeß heißt Geburtsprozeß. 

Die Gleichungen (8.3.2) und (8.3.3) nehmen hier für j=0, 1, 2,... die Form 


u a en = A, (8.4.1) 
lim 1 PalA) — Dur (AN) —=0 (8.4.2) 
0 At 


an. Mit anderen Worten, für genügend kleine At ist die Wahrscheinlichkeit für das 
Erscheinen eines neuen Elements während des Zeitabschnitts [i,# + At) gleich 
4,4t + o(At), wenn im Augenblick t die Anzahl der gerade vorhandenen Elemente 
. j betrug, während die Wahrscheinlichkeit für die Geburt von Zwillingen oder 
Drillingen usw. (d.h. für wenigstens zwei Elemente) während derselben Zeit 
gleich o (At) ist. 

Es sei nun i eine gewisse fest gewählte natürliche Zahl. Wir nehmen an, daß 
P(X, =) =1 ist, und führen folgende Bezeichnung ein: 


vol) = PX, =i+m (m=0,1,2,.... (8.4.3) 
Wenn wir ebenso wie beim Beweis des Satzes 8.3.1 schließen, erhalten wir | 
Pd + A) = Vol)Voldi), 
v„(e+4) = PnsldVrlAt) (m =1,2,...). 
Die Formeln (8.4.1) und (8.4.2) ergeben 
V,(At) =4At + o(At), 


v,(4) =1- 1414 0(At). 
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Aus den letzten vier Formeln erhält man das lineare Differentialgleichungssystem 
nd = AV), (8.4.4) 
| Ve = Arm mE) + Arm Vm-ı(E) (m =1,2, ...). 
Aus der Voraussetzung P(X, =i) =1 folgt, daß die Funktionen V„(f) die 
Anfangsbedingungen 


v„(0) = h ee - (8.4.5) 


0 für m+O 


erfüllen. Die erste Gleichung (8.4.4) ergibt also 
Volt) =erp (Al). 


Die übrigen Funktionen V„() kann man sukzessive aus dem Gleichungssystem 
(8.4.4) bestimmen. 


B. Wichtig ist der Spezialfall 
‚= Wel23..): (8.4.6) 


Einen solchen Prozeß nennt man einen Furry-Yuleschen Prozeß. FuRRY [1] 
wandte diesen Prozeß bei der Untersuchung der kosmischen Strahlung an (vgl. 
Beispiel 8.4.1), während Yurs [1] ihn in der Biologie (vgl. Beispiel 8.4.2) an- 
wandte. 

Die Gleichung (8.4.6) hat den folgenden Sinn: Die Wahrscheinlichkeit, daß 
ein schon vorhandenes Element während er Zeit At ein neues gebiert, ist nähe- 
rungsweise gleich A4t -+ o(At). Es seien nun in einem gewissen Moment schon - 
j Elemente vorhanden, und es seien die Ereignisse, daß schon vorhandene Ele- 
mente neue gebären, voneinander unabhängig. Dann ist die Wahrscheinlichkeit, 
daß während der Zeit At ein neues Element geboren wird, näherungsweise gleich 
AjAt-Ho(At), während die Wahrscheinlichkeit für die Geburt wenigstens zwei 
neuer Elemente gleich o(At) ist. 

Das Gleichungssystem (8.4.4) nimmt für einen Furry-Yuleschen Prozeß die 
Gestalt 


vlt) = AM Vol), (8.4.7) 
= aim lH Hm) (m=1,2,...) 


an..Das ist ein lineares Differentialgleichungssystem. Wenn wir die Gleichungen 
sukzessive auflösen und die Anfangsbedingungen (8.4.5) berücksichtigen, erhalten 
wir 


V„() = “ ie ) et — e-Atym (m = 0,1,2, ...). (8.4.8) 
Mm 


334 8. Stochastische Prozesse 


Wir bemerken noch, daß für beliebige t die Gleichung 


oo ji oo ,  _—_ 1 
Ent) = ae 1-—-etm—=1 (8.4.9) 
m=0 m=0 mM 
gilt. Genügen also die A; den Gleichungen (8.4.6), dann ist mit der Wahrschein- 
lichkeit Eins die Anzahl der Elemente in einem beliebigen endlichen Zeitabschnitt 
endlich. j 
Hier kann man wie in 8.3 leicht zeigen, daß der betrachtete Prozeß ein homo- 
gener Markoffscher Prozeß ist. Für beliebige t, und t, (0 <t, <t,< oo) und be- 
liebige m, j(m < j) besteht die Gleichung 
Pu (1 be) = ( E 


.) em — ein „(= Pmilt); (8.4.10) 


dabeiit i=t, — bı. 
Weiter gilt für diesen Prozeß der Ergodensatz; es ist nämlich 


Iimp;lt)=0 (m=1,2,...;52 m). (8.4.11) 
io 


Die Intensitäten werden für m = 1,2,3,... durch 


ee _ = mA, (8.4.12) 

t>0 
2A adry 

ee EI (8.4.13) 

oo 4 0 für djem,m-+i 
gegeben, und es ist 
2 Im; = Im: (8.4.14) 
7 


jm 

Beispiel 8.4.1. Die kosmische Strahlung besteht hauptsächlich aus zwei Bestandteilen: 
aus der sogenannten harten und der weichen Strahlung. Die harte Strahlung setzt sich größten- 
teils aus Mesonen zusammen; ihren Namen verdankt sie der Tatsache, daß sie sogar durch 
meterdicke Bleiwände hindurchgeht. Die weiche Strahlung besteht aus Negatronen, Positronen 
(wir wollen sie Elektronen nennen) und aus Photonen; ihr Name stammt daher, daß schon 
eine 10 cm dicke Bleiwand diese, Strahlung vollständig absorbiert. Die Theorie der harten 
Strahlung sowie die Deutung der erhaltenen experimentellen Ergebnisse ist noch nicht weit 
entwickelt. Anders ist es in der Theorie der weichen Strahlung. Arıey [1] widmete den ver- 
schiedenen stochastischen Prozessen, die Anwendung in der Theorie der weichen Strahlung 
finden können, eine ausführliche Monographie. Dieser Monographie entnehmen wir das 
Material für das folgende Beispiel, bei dem zwei radioaktive Umwandlungen erfolgen können: 
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1. Ein Photon durcheilt in einem gewissen Medium den Weg A: und unterliegt mit einer 
gewissen Wahrscheinlichkeit der Absorption, indem es zwei Elektronen emittiert. 


2. Ein Elektron kann mit einer gewissen Wahrscheinlichkeit auf Kosten seiner Energie 
ein Photon emittieren. 


Ein Elektron (oder Photen) kann also den Anfang einer Kette von aufeinanderfolgenden 
. Umwandlungen bilden. Wenn nämlich die erste „Generation“ aus einem Elektron besteht, 
so besteht die zweite aus einem Photon; dieses wiederum kann das Enistehen zweier Elek- 
'tronen in der dritter „Generation“ bewirken usw. Es entsteht also ein Elekironen- oder 
Photonenstxom. Wir sprechen hier von einer „Kaskade‘ oder einem „Kaskadenprozeß“. Es 
sind nur experimentelle Beobachtungen der Elektronen inöglich, es kann also nur jede zweite 
„Generation“ beobachtet werden, 

Es sei X, dio Anzahl der Biektronen in der Tiefe t (die ‚‚Zeit‘‘ i bedeutet hier also Tiefe). 
Furry j1} vernachlässigte die mittlere Photonengeneration und nahm an, daß ein Elektron, 
das den Weg At durchlaufen hat, sich mit der Wahrscheinlichkeit Adt+ o(At} in zwei 
Elektronen umwandeln kann und daß jedes Elektron unabhängig von den iibrigen Elektronen 
dieselben Möglichkeiten der Umwandlung hat, so daß die Gleichung (8.4.6) erfüllt ist. Diese 
Annahmen bedeuten, daß der Kaskadenprozeß dem Gleichungssystem (8.4.7) genügt. Das 
Furrysche Modeil ist eine bessere Näherung im Vergleich zur Arbeit von BrasuA und HEITLER 
[1], die annahmen, daß der Kaskadenprozeß ein Poissonscher Prozeß ist. Aber auch das 
Kurrysche Modeil iss noch ungenügend, da es noch nicht die Möglichkeit berücksichtigt, daß 
Elektroneu infolge eines Energieverlustes bei der Emission von Photonen verschwinden 
können. ArLur [£] "etrachtete ein. Modell, das den eben erwähnten Ansprüchen genügt 
und gut mit den exrerimentellen Ergebnissen übereinstimmt. Einzelheiten findet der Leser 
in der züiierten Arleyschen Arbeit. 


Beispiel 8.4.2. Den Geburtsprozeß wandte YuLe [1] auf eine biologische Gesamtheit 
au, I der sich die Elemente durch Zweiteilung fortpflanzen, Wenn wir annehmen, daß die 
einzelnen Elemente der Gesamtheit keinerlei Einfluß aufeinander ausüben, d.h., daß die 
Teilungen unshbl ‘ voneinander erfolgen, so können wir das oben betrachtete Modell 
anwenden. Fwec} ;rechend ist ein Modell, das auch die Todesfälle berücksichtigt. Ein 
solches Made! ha 2R [3] ausgearbeitet. 


©. Wir wollen €... Mittelwert Z(X,) und die Dispersion. D2(X,) des Geburten- 


prozesses berechnen. Dazu benutzen wir eine von ArLEY [1] stammende Methode. 
Wir führen folgende Bezeichnungen ein: 


BX)=E(), EX) =B,(), DK) = Deu. 
Es ist 


o© 


Ei) = Di + m) Pl). 
m=— 
Aus den Formeln (8.4.7) srhalten wir?) 


E= Ze +my,$=ANeHmVne) = AEl), 
m=od 


1) Man zeigt leicht, daß die Difierentiation unter dem Summenzeichen gestattet ist. 
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also ergibt sich bei Berücksichtigung der Anfangsbedingungen E(0) = i 
Bit) = ie. (8.4.15) 
Weiter ist 
Eh) = Le tm’ Val); 
m=0 


daraus folgt!) 


(3,0) = Si +meVa = Lü+m)(2i + 2m +1) Vntt) 
m—0 m=0 


— 2AE,(t) + ABER). 
Wenn wir die Anfangsbedingungen E,(0) = i? berücksichtigen, erhalten wir 
B,() = eitfie Lil — ee] (8.4.15) 


als Lösung dieser linearen Differentialgleichung. Daraus und aus (8.4.15) ergibt‘ 
sich 


D2(t) = E,(t) — [Et]? = il — et). (8.4.16) 


D. Oben erwähnten wir, daß beim .Furry-Yuleschen Prozeß für beliebige i die 
Gleichung (8.4.9) gilt. Die Funktionen Y„(t), die das Differentialgleichungs- 
system (8.4.4) lösen, brauchen aber nicht für beliebige A; die Gleichung (8.4.9) zu 
erfüllen; es kann nämlich 


Un) <i (8.4.17) 


sein. Das bedeutet, daß während eines gewissen endlichen Zeitabschnitts mit 
positiver Wahrscheinlichkeit unendlich viele Elemente auftreten können, und 
das ist dann der Fall, wenn A, für j— oo schnell gegen oo strebt. Dieser Sach- 
verhalt folgt aus nachstehendem Satz, der ein Spezialfall des Feller-Lundberg- 
schen Satzes ist.?) 


Satz 8.4.1. Die Beziehung 


= © (8.4.18) 


1) Man zeigt leicht, daß die Differentiation unter dem Summenzeichen gestattet ist. 
2) Der Feller-Lundbergsche Satz betrifft auch inhomogene Geburtsprozesse (vgl. FELLER 
[4] und Lunpsgere [1]). j j 
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ist eine notwendige und hinreichende Bedingung dafür, daß die Lösungsfunktionen 
V„(t) von (8.4.4), die die Bedingungen (8.4.5) erfüllen, der Gleichung (8.4.9) genügen. 


Beweis, Wir setzen 
m 
Ww=3V,ll) . (m=0,1,2,...) 
r=0 ö 
und erhalten damit aus (8.4.4) 


O-TON) = Arm Val). 


T=0 


‚Wenn wir beide Seiten der letzten Gleichung integrieren und die Anfangsbedin- 
gungen berücksichtigen, ergibt sich 


4 
1 Wal) = Arm [Imtt) di. (8.4.19) 
o 


Da die Funktionen V,(f) nicht negativ sind, ist 1 — W„(f) bei festem t eine nicht 
wachsende Funktion des Arguments m. Es existiert also auch der Grenzwert 


Tl) =1lim [1 — #0): 
woraus sich 
{ 
Am [Ym) A UL) 
0 


ergibt. Es ist weiter 


! t 
m m 1 \ 
[oa =) [oa = UN —. (8.4.20) 
r=0 7-0 Aitr 
{) {) 
Es sei nun (8.4.18) erfüllt. Die linke Seite von (8.4.20) ist nicht größer als t, 
da W„({) <1 auf Grund der Beziehung (8.4.17) ist. Dagegen. wächst die rechte 
Seite von (8.4.20) für m — oo gegen Unendlich, wenn U(t) >0 ist. Damit die 
Ungleichung (8.4.20) gilt, muß U)=0, also lim W„() =1 sein, und das 


M>00 


bedeutet, daß die Gleichung (8.4.9) erfüllt sein muß. 
Nun sei die Gleichung (8.4.9) für jedes t erfüllt. Aus (8.4.19) folgen für jedes r die 
Ungleichungen 


22 Fisz 
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und somit gilt für alle m und # die Ungleichung 


t 
EvWa<s. 
r=0 1T=0 Aitr 


0 


Nun vollziehen wir den Grenzübergang auf beiden Seiten dieser Ungleichung für 
m — ©. Nach (8.4.9) erhalten wir dann auf der linken Seite i. Da dies für jedes ? 
gilt, muß die auf der rechten Seite gewonnene Reihe divergent und damit die Be- 
ziehung (8.4.18) erfüllt sein. Damit ist der Satz bewiesen. 

Der Satz 8.4.1 ist ein Spezialfall des allgemeinen Satzes von FELLER [4], der die 
Bedingungen dafür angibt, daß die Gleichung (8.4.9) für einen homogenen Mar- 
koffschen Prozeß mit abzählbar vielen Zuständen gilt. Luwpsere [1] hat den 
Satz 8.4.1 auf einen inhomogenen Geburtsprozeß verallgemeinert, d.h. auf den 
Fall, daß die Koeffizienten A, Funktionen von i sind. Mit einer weiteren Verall- 
gemeinerung des Satzes 8.4.1 werden wir uns in 8.5.A beschäftigen. 

Wie wir sehen, erfüllen die Intensitäten eines Furry-Yuleschen Prozesses die 
Beziehung (8.4.18). 

Ist die Ungleichung (8.4.17) erfüllt, so kann sich der Prozeß während eines ge- 
wissen Zeitintervalls im Zustand ‚unendlich‘ befinden. 

Doos [3] hat gezeigt, daß man auch diesen Spezialfall wahrscheinlichkeits- 
theoretisch deuten kann, indem man allgemein sagt, daß der Prozeß von einem 
Zustand zum anderen in unendlich vielen Schritten übergeht. Dieses Problem ist 
sehr subtil. Den interessierten Leser verweisen wir auf den schon zitierten Artikel 
von Doo®. 
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Wir erhalten eine weitere Verallgemeinerung der in 8.4 behandelten Prozesse, wenn 
wir annehmen, daß bei dem Prozeß Elemente nicht nur hinzukommen, sondern 
auch verschwinden können. In dem betrachteten physikalischen Beispiel über die 
Radioaktivität wird ein Modell, das auch die Absorption von Elementarteilchen 
berücksichtigt, der Wirklichkeit näherkommen als ein Modell, das nur die Ent- 
stehung der Teilchen berücksichtigt. Auch bei der Arbeit einer Telefonzentrale 
wird ein Modell, dasnicht nur die Anzahl der begonnenen Gespräche berücksichtigt, 
wie das schon beim Signalprozeß der Fall war, sondern auch die Anzahl der wäh- 
rend eines gewissen Zeitabschnitts endenden Gespräche zählt, eine bessere mathe- 
matische Idealisierung der wirklichen Bedingungen sein, unter denen eine Telefon- 
zentrale arbeitet. Derartig verallgemeinerte Prozesse nennt man Geburts- und 
Todesprozesse. Weitgehende Verallgemeinerungen wollen wir nicht behandeln, 
sondern uns auf die Betrachtung einer möglichst einfachen Verallgemeinerung 
in dieser Richtung beschränken, die das Wesentliche des Problems klar zum 
Ausdruck bringt. 
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A. Wir betrachten wieder einen Signalprozeß {X,0 << oo}, der den Bedin- 
gungen I bis III von 8.3 genügt und die Intensität A besitzt. Wir wollen die „Lebens- 
dauer‘ 7 eines Signals betrachten, die eine Zufallsvariable ist. Diese möge eine 
Exponentialverteilung haben. Ihre Dichtefunktion g(t) hat dann die Form 


0 für 2<0O, 
PO EE S 
pe für £>0, 


wobei u >0 ist. 


Die Voraussetzung, daß die Lebensdauer eines Signals eine Exponentialver- 
teilung haben soll, ist in vielen Anwendungen eine gute Näherung und hat auch 
theoretisch große Bedeutung. In der Tat erhalten wir unter diesen Voraussetzungen 


im Past HAT _ PL <T<t+A) 


4-0 At an AMP(T2i 
__ IN _ 
"Pras, 


Also ist die Wahrscheinlichkeit dafür, daß das Signal im Zeitintervall [f, 8 + At) 
erlischt, nachdem es schon t Zeiteinheiten gedauert hat, für kleine At gleich 
„At -+o(At), und diese Wahrscheinlichkeit hängt nicht von t ab, d. h., sie hängt 
nicht davon ab, wie lange das Signal schon dauerte. Unter diesen Bedingungen ist 
das Erscheinen und Erlöschen der Signale ein Markoffscher Prozeß. 

Wir setzen außerdem noch voraus, daß die Lebensdauern der einzelnen Signale 
voneinander unabhängig sind und auch unabhängig von der Anzahl der beginnen- 
den Signale sein sollen. Weiter sei die Anzahl der Signale, die in einem gewissen 
Intervall erlöschen, nur von der Länge dieses Intervalls abhängig, nicht aber von 
den Endpunkten dieses Intervalls. Hört man also x Signale im Moment t, so ist die 
Wahrscheinlichkeit dafür, daß ein Signal im Zeitintervall [i,# + 4t) erlischt, 
gleich #iAt + o(At), während die Wahrscheinlichkeit für das Erlöschen von 
wenigstens zwei Signalen von der Ordnung o(At) sei. Ebenso sei die Wahrschein- 
lichkeit dafür, daß in der Zeit At ein neues Signal auftaucht und ein schon vorhan- 
denes erlischt, ebenfalls von der Ordnung o(A!). 

Wir bezeichnen mit Y, die Anzahl der im Moment i hörbaren Signale und be- 
trachten den Prozeß {7,0 <<< oo}. Der Prozeß soll im Zustand 7 sein, wenn j 
Signale im Augenblick £ hörbar sind. Wir wollen die totale Wahrscheinlichkeit 
c,(t) dafür berechnen, daß sich im Augenblick t der Prozeß im Zustand 5 befindet: 


s)=PN=) G=012.... 


22* 
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Es ist 
+ A) = lt)tl — AAt + oA] + Lad + oA] + o(AN), 
(8.5.1) 
(+ A) = gzlt)[L — AAt + 0(At)][ — ujdt + 0o(At)] (8.5.2) 
+ 1) [AAt + o(A2)] 
+4 W)laG + N1At+o(At)] + o(At) G=12...). 


In der Tat, der Prozeß kann im Augenblick t# + ft nur dann im Zustand Null 
sein, wenn er entweder im Moment i in diesem Zustand war und während des 
Intervalls [t, t + At) kein neues Signa] hinzugekommen ist oder wenn der Prozeß 
im Augenblick t im Zustand Eins war und im Intervall [f, At +) dieses Signal 
erloschen ist. Damit haben wir Gleichung (8.5.1) begründet. 

Weiter kann der Prozeß im Augenblick + At im Zustand 7 (> > 1) sein, 
wenn er entweder schon im Augenblick t im Zustand 7 war, in dem Intervall 
[£,t + At) kein neues Signal hinzugekommen und auch kein altes erloschen ist 
oder wenn der Prozeß im Augenblick t im Zustand j — 1 war und in dem Inter- 
vall [,6-+4t) ein neues Signal hinzugekommen ist oder wenn der Prozeß 
im Augenblick tim Zustand j +1 warundin dem Intervall [t,t-+ At) ein vor- 
handenes Signal erloschen ist. Die Wahrscheinlichkeit aller anderen Möglichkeiten 
ist von der Ordnung o(At). Damit haben wir die Gleichung (8.5.2) hergeleitet. 

Aus diesen Gleichungen erhalten wir die Differentialgleichungen 


ot) = Alt) + rc); (8.5.3) 
hr) - AH) Hd Ger...) 


Wir haben also wieder ein unendliches System linearer Differentialgleichungen 
erhalten, die aber diesmal keine rekursiven Beziehungen sind. Dieses Gleichungs- 
system wollen wir mit Hilfe von erzeugenden Funktionen lösen. Dazu führen wir 
die Bezeichnung 


1) = Los Ä (8.5.4) 
ein und erhalten | 

oftt, © de;lt) , 

FEN = + Ran 


As — S)s + 2ucli)s(l —s) + 
= a9) Lo + u Lie” 
j=0 j= 


oft, s) 


+ 
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Die erzeugende Funktion f( t, s) erfüllt also die lineare Remele Ditferential- 
gleichung erster Ordnung 


of Als: 
0-92 - 


= -i1—9f. (8.5.5) 


Wir wollen annehmen, daß im Moment ? = 0 
0-1, 40)=-0 (+) 
ist. Die Funktion f(t, s) erfüllt also die Anfangsbedingung 
f0,s) = 8. (8.5.6) 


Durch die Beziehung V(s,t,f) =0 definieren wir eine neue Funktion V. Aus 
(8.5.5) ergibt sich mit Hilfe von 


of _ _oVov 8 _ov.ov 


se aa a ao 
für V die homogene lineare partielle Differentialgleichung erster Ordnung 


oV oV eV 
de Ne, N (8.5.7) 


Die Gleichung (8.5.7) ist dem gewöhnlichen linearen Differentialgleichungs- 
system 


Men 
ul — s) 

ee 

8 Ar 


äquivalent, dessen Lösung die Form 
ut—log(l—s)=a, 
As—ulgf=a 

hat. Dann besitzt die Lösung der Gleichung (8.5.7) die Gestalt 
18 — wlogf = ylat — log(l — S)}; 


dabei ist p eine beliebige Funktion. Daraus erhalten wir 


f= exp I% [Rs — y(ut — log (1 — s))] 1 (8.5.8) 
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Aus der Anfangsbedingung (8.5.6) kann man die Funktion y bestimmen. Wir er- 
halten nämlich 


ui log s = 10 — p(ios > ) 
1—s 


Wenn wir y =log ‚also s=1 — e”’ setzen, ergibt sich 
$ 


1 
vy) =Al— er) -inlog(l —e”®), 

also 
ylat — log — s)] = All — (1 S)er] — vilog [1 — (1 — SJer#!]. 


Schließlich finden wir 
fe )=[1—- (1 s)e"f exp I- 2a (1—-s)(1— |. (8.5.9) 
j u 


Der zweite Faktor auf der rechten Seite von (8.5.9) stellt (vgl. 4.7) die erzeugende- 
Funktion einer Zufallsvariablen dar, die eine Poissonverteilung besitzt und deren 
Mittelwert (also auch deren Dispersion) gleich 


Zu-em) 
u 


ist; der erste Faktor ist die erzeugende Funktion einer Binomialverteilung, bei der 
die Wahrscheinlichkeit eines Erfolges gleich e”*! ist. Der Erfolg besteht hier darin, 
daß ein Signal mindestens während der Zeit t andauert. Also ist Y, für jedes £ 
die Summe zweier unabhängiger Zufallsvariabler, von denen die eine eine Poisson- 
verteilung besitzt und die andere binomial verteilt ist. Daraus folgt 


min (i,5) N A\Tk Pa (1 — erut\irj—2k 
u en 


k/\n GM)! 


0=01,23+%) (8.5.10) 


c;(f) = exp E m 1-— | 


k=0 


Biry = Fuer) Hier, 


D(Y) = (1-e) (4 Hi) 
Au 


Diese Formel stammt von Parm [11]. 
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In dem Spezialfall © = 0 hat Y, eine Poissonsche Verteilung, und es ist 


ee zo 


| za zujle G=0,1,2,...). 


;! 
(8.5.11) 
Es ist 


5) = za (O)2;(b). 
Aus der Anfangsbedingung c,;(0) =1 folgen die Gleichungen 


rl) G=0L2,...). 


Da aus (8.5.10) E 
nee 
90 0° für j#i 


folgt, erhalten wir bei Berücksichtigung der Formeln (8.5.3) die Intensitäten 


1-2 . 1 6gf{ a . 
PN u U BER ng Keil) BR URR BR (8.5.12) 
9 t >0 17 
\ iu fü jei-1, 
im a9 ae 
4; =im =) =} für jeitl, (8.5.13) 
A 0 für j#i-Lii+l. 


Es läßt sich leicht zeigen, daß für jedes t die Ungleichung 
u 
Zu) =1 
j=0 
gilt. 
Wenn jedoch die Intensität A für das Auftreten eines Signals eine Funktion der 
Anzahl der aktuell tätigen Signale ist und damit die Form A, hat, während die 


Intensität für das Verschwinden eines unter den ; aktuell tätigen Signalen von der 
Form u; = ui ist, so kann die Ungleichung 


gelten. 
Notwendige und hinreichende Bedingungen dafür, daß in der letzten Reihe 
für jedes i das Gleichheitszeichen gilt, wurden von DosruscHix [1] und von 
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REUTER und LEDERMANN [1] angegeben, die damit den Satz 8.4.1 verallgemeinert 
haben. 
Aus (8.5.10) erkennt man, daß die Verteilung von Y, für t— oo gegen die 


Poissonsche Verteilung mit dem Mittelwert 2 konvergiert (unabhängig vom 
Anfangszustand). Also ist . 


.) 
c; = lim c;(t) = 1) exp (- .) (=0,1,2,....). (8.5.14) 


Die Frage nach der Existenz der Grenzwerte c; hat schon ERLANeG [1] in seinen 
grundlegenden Arbeiten über die Anwendung der Wahrscheinlichkeitsrechnung 
im Fernmeldewesen gestellt. 


Beispiel 8.5.1. Wir betrachten die Tätigkeit einer Telefonzentrale, die soviel Leitungen 
besitzt, daß jedes in einem beliebigen Moment auftretende Signal eine freie Leitung vor- 
findet; mit anderen Worten, die Zentrale besitze unendlich viele Leitungen. Wenn wir mit 
Y, die Anzahl der im Augenblick t belegten Leitungen bezeichnen, so sehen wir, daß Y, ein 
Prozeß mit abzählbar vielen Zuständen ist. Die oben gefundene Formel (8.5.10) erlaubt 
uns, für jedes £ die totale Wahrscheinlichkeit % () = P(Y, = 5). zu berechnen, während die 
Formel (8.5.14) den Grenzwert c, dieser Wahrscheinlichkeit für #—oo angibt. 

Beispiel 8.5.2. Wir betrachten jetzt die Tätigkeit einer Telefonzentrale mit endlich 
vielen Leitungen. Diese Telefonzentrale sei so beschaffen, daß ein Signal, das in einem Augen- 
blick, in dem alle Leitungen belegt sind, auftaucht, nicht auf eine freie Leitung wartet, sondern 
wegfällt. Wir sagen, daß die Zentrale mit Verlust arbeitet. Das wichtigste Problem, das vor 
dem Bau einer solehen Zentraie zu lösen ist, ist die Bestimmung der Wahrscheinlichkeit 
dafür, daß im Augenblick t alle Leitungen belegt sind. Dieses Problem wollen wir nun be- 
handeln; dabei beschränken wir uns auf die Bestimmung der Grenzwerte der gesuchten 
Wahrscheinlichkeit für ?—oo. 


B. Es sei Y, wie bisher die Anzahl der im Augenblick # hörbaren Signale. Wir 
wollen alle bisherigen Voraussetzungen beibehalten mit dem einzigen Unterschied: 
Die Anzabl der Zustände dieses Prozesses sei endlich 5 =0,1,..., m), also 
c,(t)=0 für j> m. Die Gleichungen (8.5.1) und (8.5.2) bleiben für j =1,..., 
m — 1 richtig, während sich für j—= m die Gleichung 


mt + At) = mt) — umAt + 0{AM)] + Om-(iTAAE + 0(A1)]+0(At) 
ergibt. Wir erhalten also das Differentialgleichungssystem 

He = Al) + Ra); (8.5.15) 

el) Ad - Aid Geb. „m—h), 


G 


ca) = Alm lt) — umen(t) 
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und stellen uns die Aufgabe, den Grenzwert c,; der Funktion c;(t) für t >00 zu 
finden. Dieser Grenzwert ist, wie wir gleich sehen werden, unabhängig von der 
Anfangsverteilung c;(#) G=0,1,...,m). In der Tat, die Voraussetzungen des 
Satzes 8.2.1 sind erfüllt, a. h., es gibt ein solches i*, daß die Übergangswahrschein- 
lichkeiten 2,() 6,5 =®,1,...,m) positiv sind. Es gilt also der Ergodensatz, 
und es existieren die Wahrscheinlichkeiten p,; = lim 2,;{f) für j = 0,1,..., m. 
5 1->00 2 
Aus dem Satz 8.2.2 folgt dann die Existenz der Grenzwerte c,; = lime;(t) = p,, 


i->00 


die, wie wir wissen, von der Anfangsverteilung unabhängig sind. Wir haben also 

gezeigt, daß die rechten Seiten der Gleichungen (8.5.15) für {— oo einem Grenz- 

wert zustreben. Dann existieren auch die Grenzwerte der Funktionen c; (t). Diese 

Ableitungen können aber nur.gegen Null streben, da sonst c,(t) gegen Unendlich 

gehen würde. Also erhalten wir für die Bestimmung der Konstanten c,; das Glei- 
" ehungssystem 


Ag tu. =®0, 
la - Ati) Gr Dn=0 G=h..,m—1), (8.5.16) 
Alm-ı — KM = 0. 


Aus diesen Gleichungen ergibt sich 


Mm). . (8.5.17) 


Diese Formeln erhielt bereits Erzane [1]. 


Beispiel 8.5.3. Tabelle 8.5.1 enthält die Werte c,, die nach der Formel (8.5.17) berechnet 
wurden, für m = 5 und m = 10, wobei A= u und A = 2% gesetzt wurde. Aus dieser Tabelle 
liest man ab: Für A = 2% und fünf Zuleitungen ist die Wahrscheinlichkeit, daß alle Leitungen 
belegt sind, ziemlich groß. Sie beträgt nämlich ungefähr 0,04, d. h., ungefähr jeder fünfund- 
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zwanzigste Anruf geht verloren. Dagegen genügen 10 Leitungen für dasselbe Verhältnis 
A = 24 vollständig. Für A= 4 ist die Wahrscheinlichkeit, daß alle Leitungen belegt sind, 
schon für m=5 sehr klein. 


Tabelle 8.5.1. Werte von c;, berechnet nach (8.5.17) 


m=85 mio 
? a = 2u ve A=2u 
0 0,36810 0,13761 0,36788 0,13534 

1 0,36810 0,27523 0,3678 0,27067 

2 018405 | 0.275233 0,18394 0,27067 

3 0.06135 0,18349 0,06131 0,18045 

4 0,01534 0.09174 0,01533 0,09022 

5 0,00307 0,03670 0,00307 0,03609 

6 | 0,00051 0,01203 

7 0,00007 0.00344 

8 0.000041 0,00086 

9 0.00000.. 0,00019 

10 0,00000.. 0,00004 


€. Wir betrachten jetzt einen anderen Typ einer Telefonzentrale mit endlich vielen 
Leitungen, nämlich eine Zentrale mit Warteplätzen. Diese Zentrale ist so konstru- 
iert, daß die ankommenden Signale eine Warteschlange bilden, falls alle Leitungen 
besetzt sind, und so lange warten, bis eine Leitung frei wird. Für die Arbeit einer 
Zentrale dieses Typs sind zwei Probleme wesentlich: 


1. Bestimmung der Wahrscheinlichkeitsfunktion für die Anzahl derjenigen 
Signale, die warten müssen; 


2. Bestimmung der Verteilungsfunktion der Wartezeit. 


Mit dem ersten Problem hat sich KotmocororF [4] beschäftigt. Wir wollen hier 
die Lösung des Problems skizzieren. Dabei beschränken wir uns darauf, die Grenz- 
werte der gesuchten Wahrscheinlichkeiten für £— oo zu bestimmen. 

Mit dem zweiten Problem hat sich schon ErLane [1] beschäftigt. Weiter unten 
bringen wir unter gewissen einfachen Voraussetzungen die Lösung des zweiten 
Problems. 

Diese Problematik gibt es nicht nur im Telefonwesen, sondern auch in vielen 
anderen Gebieten der Technik und des täglichen Lebens. So kann man z.B. die 
Fahrkartenschalter eines Bahnhofs als ‚„‚Zentrale‘‘ ansehen, ein ‚Signal‘ ist hier 
das Erscheinen eines Passagiers am Schalterfenster. Der Prozeß ist im Zustand j, 
wenn j Passagiere entweder eine Fahrkarte kaufen oder Schlange stehen. Es ist 
klar, daß die Eisenbahndirektion sowohl über den Andrang der Reisenden als 
auch über die Schnelligkeit der Abfertigung Erkundigungen am Schalter einziehen 
muß, um auf eine vernünftige Weise die Anzahl der nötigen Schalter zu regeln. 
Solche Prozesse heißen Massenbedienungsprozesse. 
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Es bezeichne jetzt Y, die Anzahl der Signale, die im Augenblick t entweder 
andauern oder auf das Freiwerden einer Leitung warten. Wir nehmen wieder 
an, daß der Strom der aufleuchtenden Signale den Bedingungen I bis III von 
-8.3 genügt und die Intensität A besitzt und daß die Signaldauer eine Exponential- 
verteilung mit dem Parameter u hat. Ebenfalls wollen wir wieder die übrigen 
Voraussetzungen machen, die zum Gleichungssystem (8.5.3) führten. Es sei 


= PN=)), 
und die Anzahl der Leitungen sei gleich m. Die Gleichungen (8.5.1) und (8.5.2) 
bleiben für 0<j< m unverändert, da sich in dem Fall wenigstens eine freie 
Leitung findet und das auftauchende Signal nicht zu warten braucht. Dagegen ist 
- für j>m 

st + At) = c;li)fl — umAt + olAi)][L — AAt-+ o(At)] 

+ 1 IAAE + 0(A1)] + Ge l!)TamAt + 0(At)] + o(At). 

Die letzte Gleichung unterscheidet sich von (8.5.2) darin, daß auf der rechten Seite 
um an Stelle von #j und u(j + 1) steht, weil die Anzahl der tätigen Signale 


nicht größer als m sein kann. Schließlich erhalten wir das Differentialgleichungs- 
system 


cl) = AG) + alt), | (8.5.18) 
4) = Ay) - AH) +RG+ DH) G=12%..,m-1), 
4) = Al) - A+mmal) + mul) Gm). 

Man kann auf Grund von (8.5.18) zeigen, daß das Gleichungssystem 
Ant =0, . (8.5.19) 
ka - Ati ++ Dn=0 (=h...,m-1), 
Ag — (A+ mu); + ame =0 G=emm+l,...) 


existiert, wobei c; = lim c,(f) ist. Als Lösungen dieses Gleichungssystems er- 
halten wir ES 


; 
le) Co (=1, m), 
_ 3! \a 
= \ a (8.5.20) 
m! miTr (x) nen 
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Es ist 
1 oo m 1 m [e) j 
au, (2) + 2. (+) (8.5.21) 
Co ;=0 j-o 3! \u m! nr \mu 
4 


Ist m s —, so strebt die rechte Seite der letzten Gleichung gegen oo. In diesem 


u 
Fall existiert keine Grenzverteilung; denn die Beziehung 


1 
= N,=0 
Co j=0 


kann nur gelten, wenn c, +0 und B3 6; = 00 ist (die c, sind dann keine Wahr- 
j=0 
scheinlichkeiten) oder wenn «= ist. Dann folgt!) aber aus den Formeln 
(8.5.20) ,=0(j=0,1,2,...) 
Im letzten Fall ist die Wahrscheinlichkeit dafür, daß die Anzahl der auf Ent- 
lastung wartenden Signale unendlich wird, gleich Eins. 


u x 
Ist — < m, so setzen wir Vo; —1 und erhalken aus (8.5.21) 
u 


j=0 
n 1 
mia 1 1 (Ami 
“ u) * a 
mM -— — 
u 
und schließlich 
1.2) 
I u he 
m 1 Fi k 1 1 2 m+1 gG=0,1,2, Mm); 
fee 
vo k!\u m!) _ A\e 
B 
6; = 
| | rain! 
m!mTr\u ; 
my [A\* 1 1 A\m+ı vem+N. 
u) al 
(8.5.22) 


1) In diesem Fall gilt lim c;(l) = 0 5 = 0,1, 2,...), obwohl lim —— 5 4() = © ist. 
1>00 = 


t->00 69 j=0 
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Obwohl wir es in praktischen Fragen immer mit endlich vielen Signalen zu tun 
haben, können doch die praktischen Konsequenzen der Tatsache, daß ms 4 


ist, ernstlich die Tätigkeit einer ‚Zentrale‘ stören, da endlose Schlangen entstehen 
können. Die Anzahl der „Leitungen“ darf also nicht zu klein sein. 

Wir bezeichnen jetzt mit Z die Wartezeit eines Signals auf das Freiwerden 
einer Leitung. Dabei seien im Augenblick t des Aufleuchtens dieses Signals alle 
Leitungen belegt, d.h., es sei Y,= m. Unsere Aufgabe besteht nun darin, die 
Wahrscheinlichkeit P(Z>z) für z=>0 zu berechnen. Wir beschränken uns 
auf große Werte von i, fürdieman die Grenzformeln (8.5.22) benutzen kann. Da Y, 
im Augenblick, wenn das betrachtete Signal aufleuchtet, nur gleich einer Zahl sein 
kann, die nicht kleiner als m ist, erhalten wir nach dem Satz über die totale 
Wahrscheinlichkeit 


P(Z>2)= FoP(Z >: |Yı=)). (8.5.23) 
jem 


Für Y,=j und j>m ist die Anzahl der wartenden Signale gleich j — m. 
Besteht die Ungleichung Z.> z, so erlöschen in der Zeit 2, gerechnet vom Auf- 
leuchten des betrachteten Signals an, höchstens 5 — m Signale. Aus der Vor- 
aussetzung, daß die Signaldauer eine Exponentialverteilung mit dem Parameter u 
besitzen soll, und aus den übrigen Voraussetzungen über die erlöschenden Signale, 
die am Anfang dieses Paragraphen formuliert wurden, sowie schließlich aus der 
Tatsache, daß die Anzahl der belegten Leitungen stets gleich m ist (jede frei- 
werdende Leitung wird doch sofort vom nächsten wartenden Signal belegt), folgt, 
daß der Strom der erlöschenden Signale einen Poissonschen Prozeß mit der Inten- 
sität mu bildet. Dann ist nach der Formel (8.3.4) die Wahrscheinlichkeit dafür, 
daß ! Signale in der Zeit z erlöschen, gleich 


(umz)' 
1! 


exp (-um2); 


die Wahrscheinlichkeit P(Z>21Y, = ) dafür, daß in der Zeit z höchstens 
5 — m Signale erlöschen, ist also gleich 


im ı 
PIZ> Yu = 3) =exp(—uma) 2 EREL. 


(8.5.24) 


Wir schreiben (8.5.22) für j> m +1 in der Form 


i-m j 
= m dr (2) i (8.5.25) 


mM \u 
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Aus (8.5.23) bis (8.5.25) erhalten wir 


im ! 
PZ>y=N%g Zexp(—um2) mu 
j= mn I=0 5 
\j-m j-m I 
= xp (ums) Don gem S ma 
Zn er 1 


en, Ku 2a)” 
=0 j= m+ 


ee) 
i=0 j=m+1 


Mr oo l 
gi merp (—um2) (42) m exp[— (mu — A) 2]. 
1 mo 8! A 
1- — ee 
um AM 


Als endgültiges Resultat haben wir also 


= ) exp[— (mu — A)2] 
| PZ>9)=--# 2 (8.5.26) 
Ms fen 
um 


erhalten. 


D. Für das weitere Studium der Geburts- und Todesprozesse verweisen wir den 
Leser auf die Arbeiten von KARLIn und MoGr&cor [1] bis [3], D. G. Kennauı [2] 
| und ÜRBANIK [2] sowie auf das Buch von GNEDENKO, BELJAJEW und SOLOWJEW 
[1]. Eine ausführliche Behandlung der Wirkungsweise der „Zentralen“ im weite- 
sten Sinne dieses Begriffs findet man in einer Arbeit von CHINTScHIN [7] (siehe 
auch KarLın und McGrzcor [4]). Eine umfassende Übersicht über Ergebnisse 
| der Warteschlangentheorie findet man in den Büchern von RIORDAX [1], Sysk1 [1] 
und Taxäcs [6]. 

Beim Geburts- und Todesprozeß haben wir die „Lebensdauer“ eines Signals 
betrachtet. In praktischen Anwendungen ist es mitunter erforderlich, gewisse 
andere Merkmale eines Signals neben der ‚Lebensdauer‘ zu betrachten, z.B. 
dessen Amplitude, die eine Zufallsvariable sein kann. Mit anderen Worten, der ur- 
sprüngliche Signalprozeß erzeugt einen neuen stochastischen Prozeß, den man einen 
sekundären Prozeß nennt. TaxAos [1] bis [4] hat unter schwächeren Voraussetzun- 
gen über den ursprünglichen Signalprozeß und das Leben von Signalen viele wich- 
tige Ergebnisse erzielt. 

Es lassen sich auch etwas allgemeinere Modelle von Geburts- und Todesprozessen 
betrachten, z. B. solche, in denen jedes existierende Element, nennen wir es etwa 
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„Partikel“, eine oder auch mehrere neue Partikeln erzeugen kann. Man kann auch 
Modelle betrachten, in denen Partikeln verschiedener Typen unterschieden werden 
und es darum geht, die Wahrscheinlichkeitsverteilung für die Anzahl der Teilchen 
eines speziellen Typs zum Zeitpunkt i zu ermitteln. Wir nennen solche. Prozesse 
Verzweigungsprozesse. Dieser Problematik sind zahlreiche Arbeiten gewidmet, 
insbesondere die Arbeiten von KoLMOGoRoFF und DMItRiew [1], Harrıs [1], 
SEWASTJANOW [1] sowie Woons und BHArucHA-Reip [1]. Man vergleiche hierzu 
auch das Buch von BrArucaA-Reip [2]. 

Ein Verzweigungsprozeß mit diskreter oder stetiger Zeit, in dem die Zufalls- 
variablen stetig sind, wurde von JIkInA [1] untersucht. Moyar [1], [2] untersuchte 
Verzweigungsprozesse mit Zufallsvariablen eines sehr allgemeinen Typs. 
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In 5.13 beschäftigten wir uns mit der zusammengesetzten Pölyaschen Verteilung 
und leiteten die Formel (5.13.8) her, die die Wahrscheinlichkeitsfunktion einer 
Zufallsvariablen mit negativer Binomialverteilung angibt. Wir gingen von einer 
Zufallsvariablen X mit einer durch (5.13.4) gegebenen Poissonschen Verteilung aus. 
Dabei hatte der darin vorkommende Parameter A eine durch (5.13.5) gegebene 
Gammarverteilung. Jetzt ersetzen wir in der Herleitung der Formel (5.13.7) die 
Zufallsvariable X durch den Poissonschen Prozeß X,, d: h., wir ersetzen (5.13.4) 
durch 


(At* 

PR=kı)= Tape) (k=01,..), (8.6.1) 
wobei 4>0,:>0 ist. Dann erhalten wir statt (5.13.7) für k=1,2,... die 
Formel 

vw +1) Ww+(k—1)] | ge \* 
Pı()=P(X,=k= > Pt), 
»(t) ( ) k a of) 
wobei 


Pl) =P(X=0)= (; n j 


1 
ist. Wir setzen a =v = Fi und erhalten 


ar 


11 + 2: (k — 1)d] (Pi. (k=1,2, ...). (8.6.2) 


P,)= 1+1d 
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Die Funktionen P, (t) erfüllen die Anfangsbedingungen. 
P,0)=1 PO)=0 k=1,233,.... 


Differenzieren wir die Formeln (8.6.2), so erhalten wir für die Funktionen P,(f) 
das Differentialgleichungssystem 


Er SSORHEERL EEE 
| (8.6.3) 
1+kd 1+(k—1)d 
wie ee, =1,2,...). 
Pr) rd P,&+ ira Pr) (k 2, ...) 


Dieses Gleichungssystem hat dieselbe Form wie das System (8.4.4), wobei i =0, 
Yr (b) = Pı (2) und 


i+kd 


RT rg 


(8.6.4) 


war. Also ist der betrachtete Prozeß ein Geburtsprozeß, den wir schon aus 8.4 
kennen, mit dem Unterschied, daß A,(f) hier von t abhängt. Wenn wir den Para- 
meter ö als Zeit betrachten, ist der behandelte Prozeß nicht mehr homogen (vgl. 
Beispiel 7.3.5). Wählt man aber den Parameter r, der mit dem Parameter t durch 
die Beziehung 


_ exp(dr) —1 
= d 


t 


verknüpft ist, als „Zeit“, so wird der. Prozeß homogen. Wir erhalten nämlich 
nach entsprechenden Umformungen aus (8.6.3) 


dP,(?) ”" 


dr —P,(®), 
(8.6.5) 
u __U+KYAO+ULE- NIT) =... 


Die Koeffizienten A, =1-+ kd sind hier unabhängig von 7; der Prozeß ist also 
homogen. Diese Zeitänderung darf nicht mißverstanden werden, die Deutung des 
Parameters als „Zeit‘‘ war ja nur eine Verabredung. 

Man kann zeigen, daß die Funktionen (8.6.2) diejenigen Lösungen des Systems 
(8.6.3) sind, die den Anfangsbedingungen P,(0) = 1, P,(0) =0(k = 1) genügen. 
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Den Mittelwert Z(X,) und die Dispersion D2(X,) finden wir aus den Formeln 
(5.13.10). Es ergibt sich 


1/ td 1 
BX)=7 ( ER .) =, (8.6.6) 
D2(X,) =t(1 + td). | (8.6.7) 


Definition 8.6.1. Einen Prozeß {X,0<st< oo}, dessen Wahrscheinlich- 
keitsfunktionen P(X, =k) durch die Formeln (8.6.2) gegeben wird, nennt man 
einen Pölyaschen Prozeß. 

Ein Pölyascher Prozeß ist ein Spezialfall der sogenannten zusammengesetzten 
Poissonschen Prozesse. Man erhält diese ebenso wie die Pölyaschen Prozesse: 
Das in der Formel (8.6.1) vorkommende 4 ist eine Zufallsvariable mit der Ver- 
teilungsfunktion U(A). Ist also insbesondere U(2) durch die Formel (5.13.5) 
gegeben, so haben wir es mit einem Pölyaschen Prozeß zu tun. Ausführlich sind die 
zusammengesetzten Poissonschen Prozesse bei LUNDBERG [1] behandelt. Vorher 
wurden sie bereits von CHINTSCHIN [2] untersucht. 

Der Name Pölyascher Prozeß stammt vom Pölyaschen Versuchsschema und 
von der in 5.4 besprochenen Pölyaschen Verteilung. So bewies PöLya [1], daß die 
rechte Seite von (5.4.2) für n — oo gegen die durch die Formeln (8.6.2) definierte 
Funktion P;(f) konvergiert, wenn Iimnp=t und limra =td ist.!) Den 

n—>X RX 
Pölyaschen Prozeß kann man also auf zwei verschiedene Arten herleiten. 

ArLEY [1] wandte den Pölyaschen Prozeß in der Theorie der kosmischen Strah- 
lung an. LUNDBERG [1] untersuchte viele Anwendungen des Pölyaschen Prozesses 
in der Uniall- und Krankenversicherungsstatistik. Das folgende Beispiel haben wir 
dem zitierten Lundbergschen Buch entnommen. 


Beispiel 8.6.1. Die Versicherungsgesellschaft Sinkförsäkrings-A.B. Eir verpflichtet sich, 
den Versicherten im Fall der vollständigen Arbeitsunfähigkeit infolge Krankheit oder Unfall 
eine Unterstützung auszuzahlen. Im Lundbergschen Beobachtungsmaterial hatte (mit 
wenigen Ausnahmen) jeder Versicherte nur eine einzige Versicherungspolice. 

Die statistischen Angaben, die die Anzahl dieser Policen betreffen, können also als Angaben 
über die Versicherten angesehen werden. Die Gesamtzahl der Policen betrug 1417. Wir 
betrachten die Anzahl k der Krankheits- bzw. Unfallmeldungen in einem Zeitraum von 10 
Jahren, nämlich vom 3. bis 12. Versicherungsjahr. Die Angaben sind in Tabelle 8.6.1 auf- 
geführt. Dabei ist n, die Anzahl der Versicherten, die im betrachteten Zeitabschnitt k-mal 
einen Unfall oder Krankheitsfall meldeten; P, ist die nach der Formel (8.6.2) berechnete 
Wahrscheinlichkeit. Hierbei wurden die Parameter t und d aus dem Beobachtungsmaterial 
nach den Formeln (8.6.6) und (8.6.7) berechnet, und zwar t = 2,9273 und d = 0,9416. 

Wie man aus Tabelle 8.6.1 ersehen kann, stimmen die theoretischen Wahrscheinlichkeiten 
gut mit den beobachteten Häufigkeiten überein. 


1) Wir gebrauchen hier die Bezeichnungen aus 5.4. 


23 Fisz 
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Tabelle 8.6.1. 


k ı 
1417 Pr 

0 0,2286 0,2453 
1 0,2110 0,1911 
2 0,1475 0,1446 
3 0,1066 0,1083 
4 0,0854 0,0807 
5 0,0480 0,0599 
6 0,0416 0,0445 
7 0,0346 0,0329 
8 0,0310 0,0243 
9 0,0191 0,0180 
10 0,0085. 0,0133 
11 0,0106 0,0098 
12 . 0,0078 0,0072 
13 0,0056 0,0053 
14 0,0028 0,0039 
15 0,0028 0,0029 
16 0,0085 0,0080 

1,0000 1,0000 


8.7. Die Kolmogorofischen Gleichungen 


In 8.3 bis 8.6 betrachteten wir diskrete homogene Prozesse, bei denen sich eın 
Zustand nur durch unmittelbaren Übergang zum Nachbarzustand ändern konnte. 
In diesem Paragraphen wollen wir diskrete Markoffsche Prozesse betrachten, bei 
denen jeder Zustand in einen beliebigen anderen übergehen kann. 

Es sei {X,0=<t<o0} ein Markoffscher Prozeß mit höchstens abzählbar 
vielen Zuständen ö = 0,1,2,..., und 9,;(r,) (O<r <t <oo) seidie Übergangs- 
wahrscheinlichkeitsfunktion dieses Prozesses. Diese Funktion erfüllt dann die 
Beziehungen (8.2.6) bis (8.2.8). Die Chapman-Kolmogorofische Gleichung schrei- 
ben wir hier in der Form 


Pate t) = Zpule 9) us); (8.7.1) 


dabei ist r<s<t. Wir wollen ein Differentialgleichungssystem für die Funk- 
“ tionen 9;;(r, £) suchen. Dazu führen wir die Bezeichnungen 


g;(t) = lim 2 mu =0,1,...), (8.7.2) 
4di—>0 At 
gu) = im BEFN)  e..sie) (8.7.3) 


dt—0 A t 
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ein und nehmen an, daß in beiden Beziehungen die Konvergenz gleichmäßig 
in t ist. 

Die Größe At kann in den Formeln (8.7.2) bis (8.7.3) positiv oder negativ 
sein. Diese Beziehungen sind den folgenden Gleichungen, die für kleine At gelten, 
äquivalent: 


Pal + A) =1— gl) At + olAt), (8.7.2') 
Pl 6 + At) = gilt) At + olAt). (8.7.3°) 


Die Funktionen 9; (f) und 9;;(f) heißen Intensitätsfunktionen. 

Den folgenden Satz 8.7.1 bewies KOoLMOGOROFF in seiner Arbeit [3], die bei der 
Entwicklung der Theorie der Markoffschen Prozesse eine grundlegende Rolle 
spielte. In dem Satz werden zwei nach KoLMmoGoRoFF benannte Differential- 
gleichungssysteme hergeleitet, denen die Funktionen »;,(r, ft) genügen. Das eine 
System (8.7.4) erhält man, wenn man j und t als fest und i und r als veränderlich 
ansieht, das zweite (8.7.6), wenn man i und als fest, dagegen aber 7 und t als 
veränderlich ansieht. Da r <t ist, heißen die ersten Gleichungen (8.7.4) reiro- 
spektiv, während die zweiten (8.7.6) prospektiv genannt werden. 


Satz 8.7.1. Es seien p,;(t,t) die Übergangswahrscheinlichkeitsfunktionen. eines 
Markoffschen Prozesses mit höchstens abzählbar vielen Zuständen 05T; 
Die Intensitätsfunktionen q;(t) und q;;(t) mögen existieren und stetig sein. Dann güt: 


1. Die Funktionen p;;(t, t) erfüllen das Differentialgleichungssystem 


09; (?, i) En 


F (lt) Palo 8) — DH Gr(t) Du; (ti) (8.7.4) 
T k+i j 


bei den Anfangsbedingungen 


1 für j=i, 


8.7.5 
0 für ji. we 


Pij (, 2) == 


2. Wenn wir außerdem noch voraussetzen, daß die Konvergenz in (8.7.3) für 
jedes feste j gleichmäßig bezüglich i ist, so erfüllen die Funktionen p,;(r,t) das 
Differentialgleichungssystem 


9P; (7, i) 


Er — Pi; (tr, 8) g;() +2 Pat !) gel); (8.7.6) 
c$j . 


unter den Anfangsbedingungen 


1 für ij, 


A (8.7.7) 
0 für ij. 


Pylt,r) = 


23* 
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Beweis. Wir beweisen die Behauptung 2. Dazu schreiben wir (8.7.1) in der 
Form 


Pslr,t+ Al) = Kraul + At). 
k 
Dann erhalten wir 


Pat, t + Ai) = Pu4(t, ) EB 


i 
ar Fr [&?=0 td) Pub 6-4 At) — Pitt, a] 


1 — Pl, 6 + At) 


(6,84 At 
Be u) ee sr 


Pi (%, 2) 
k+j 4t j 

Ausden Formeln (8.7.2) bis (8.7.3), der absoluten Konvergenz der Reihe 3 P,;x(T, £) 
k 


und den Voraussetzungen über die gleichmäßige Konvergenz von (8.7.3) bezüglich 
i (hier bezüglich %) bei festem 5 folgt dann 


pl — lim Pü (t+ Al) — Dt, }) 
öt AO R At 


EN a er 
+ 


1 dt \ At->0 At 


= de) + ra) le. 
bj 


Damit haben wir die Behauptung 2 bewiesen. Der Beweis der Behauptung 1 ist 
analog. 

Man kann zeigen, daß die Gleichungssysteme (8.7.4) und (8.7.6) identische 
Lösungen p;;(7, t) besitzen, die die Formeln (8.2.6) bis (8.2.8) und die voraus- 
gesetzte Anfangsbedingung erfüllen, und daß die diesen Lösungen entsprechenden 
Intensitätsfunktionen existieren und stetig sind. Den Beweis findet der Leser 
in der Arbeit von FeELLer [1] und für den Spezialfall eines homogenen Prozesses 
in der schon erwähnten Arbeit von KoLMoGorRorr [3]. Wenn der Prozeß nur 
endlich viele Zustände hat, ist offenbar die Voraussetzung über die gleichmäßige 
Konvergenz in (8.7.3) bezüglich i bei festem 5 überflüssig. 

Falls der Prozeß homogen ist, sind die Intensitätsfunktionen, die .durch die 
Formeln (8.7.2) bis (8.7.3) gegeben werden, von t unabhängig; man kann also 
einfach g; und 9;; schreiben und diese Größen Intensitäten nennen. Die Gleichungen 
(8.7.4) und (8.7.6) haben dann die Form 


dpyli 

IN <q) — Zaun, (8.7.4) 
ki 

ER 

Bu) — —puiHa, + Dal) au (8.7.6) 
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mit den Anfangsbedingungen 


I fü j=it, 


ee (8.7.5’) 
0 für jF#i. 


P,(0) = | 

Wir weisen darauf hin, daß alle Differentialgleichungssysteme, die wir in 
8.3 bis 8.5 erhalten haben, Spezialfälle des Systems (8.7.6) sind. 

In Satz 8.7.1 nahmen wir an, daß die Beziehungen (8.7.2) und (8.7.3) erfüllt 
sind, daß also die Intensitätsfunktionen g;(f) und g;;(f) existieren und endlich 
sind. Für homogene Markoffsche Prozesse folgt dies aber, wie Doos [2] und 
KoLMmoGororr [15] gezeigt haben, aus der Voraussetzung der Stetigkeit der 
Funktion 9,,;{f) im Punkt t=0, d.h. aus der Voraussetzung 


lim p;(t) =1 G=0,1,2,...). (8.7.8) 
10 


Setzt man noch zusätzlich voraus, daß die Konvergenz in der Beziehung 
(8.7.8) gleichmäßig in ö ist, so sind die Intensitäten g; und g;; endlich. Hat aber 
der betrachtete Prozeß nur endlich viele Zustände, so folgt die Existenz endlicher 
Intensitäten aus der Beziehung (8.7.8). Die Voraussetzung (8.7.8) ist wegen der 
Anfangsbedingungen (8.7.5’) ganz selbstverständlich. 

Der Existenz der Intensitätsfunktionen 9; (t) und 9;,() sowie deren Eigenschaf- 
ten sind auch Arbeiten von Avstıv [1], [2] und Juschkewırsch [1] gewidmet. 


8.8. Rein unstetige und rein stetige Prozesse 


A. In 8.3 bis 8.7 untersuchten wir Prozesse mit höchstens abzählbar vielen 
Zuständen. Nun nehmen wir an, daß die Zufallsvariablen X, eines Markoffschen 
Prozesses {X,,0 <t <o0} beliebige reelle Werte annehmen können. Wir er- 
innern daran, daß für einen Markoffschen Prozeß und beliebige t,,1,(0 St, <t,<oo) 
die bedingte Verteilungsfunktion F(t,%,1,9) = P(X,<ylIX,=x) gegeben 
ist, Dabei ist im Einklang mit unserer Voraussetzung die bedingte Wahrschein- 
lichkeit auf der rechten Seite der letzten Gleichung für jeden Wert von & be- 
stimmt. Die Funktion F(t,, x, t,, 4) ist als Verteilungsfunktion wenigstens links- 
seitig stetig. in y und genügt den Gleichungen 


im F(t,2,1,9)=0, lim F(it,2,1,y) =1. 


y>—- 0 yo 


Außerdem sei Ft,, x, t,, y) stetig bezüglich £, und t, und eine Bairesche Funktion 
(vgl. 2.4.A) in x. Die Chapman-Kolmogoroffsche Gleichung hat hier die Form 


Fit, x, to, Y) = [Fr 2, tz, Y) d,Ft,, %, 5, 2); (8.8.1 
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wobei ti, <s< t, ist. Das Integral in (8.8.1) ist das Stieltjessche Integral von 
F (s, 2, t,, y) nach der Verteilungsfunktion F (t,, 2, s,2). Hat F (t,, %, t,, y) be- 
züglich y eine Dichtefunktion f(t,, z, t,, y), so lautet die Chapman-Kolmogoroffsche 
Gleichung 


Fi,%,t,9y) =. } F (s, 2, 1,, 9) fit, &, 8, 2) dz, (8.8.1') 
oo 


wobei ti, <s < t, ist. Die Gleichung (8.8.1) oder (8.8.1’) kann man so begründen: 
Den Übergang vom Zustand x, in dem sich der Prozeß im Moment t, befindet, 
durch einen Zustand z im Augenblick s zu einem Zustand, der kleiner als y ist 
und in dem der Prozeß sich im Augenblick t, befindet, kann man in zwei Über- 
gänge zerlegen: 1. Im Augenblick s befindet sich der Prozeß in einem Zustand, 
der zum „Intervall“ [z, z-+ dz) gehört; die Wahrscheinlichkeit dafür ist gleich 
fi, ®,s,2) de. 2. Aus dem Zustand z, in dem sich der Prozeß im Moment s be- 
findet, geht der Prozeß in einen Zustand über, der kleiner als y ist und den der 
Prozeß im Moment t, annimmt; die Wahrscheinlichkeit dieses Ereignisses ist 
gleich F(s, 2, t,, y). 
Wenn wir den verallgemeinerten Satz über die totale Wahrscheinlichkeit 
[vgl. Formel (2.7.7)] anwenden, erhalten wir (8.8.1). Aus (8.8.1’) folgt unmittelbar 


fit» 9) = [16 2 12 y) Fl ©, 8, 2) de. (8.8.2) 


Aus der Definition der Funktion F(t,, x, i,, y) und der Voraussetzung, daß sie in 
° £, und t, stetig sein soll, folgt‘ 


lim Ft, 2,1, y) = \ für y=», (8.8.3) 
oh 1 für y>z, 
lim Ft, 2,1, y) = k für yzo (8.8.4) 
a, 1 für y>. 


Dabei ist die Konvergenz in (8.8.3) linksseitig und in (8.8.4) rechtsseitig. 


B. Wir führen jetzt den Begriff eines rein unstetigen Prozesses ein. Es sei {X „te I} 
ein Markoffscher Prozeß, wobei wir nicht ausschließen, daß alle reellen Zahlen 
mögliche Zustände dieses Prozesses sein können. Es seien zwei Funktionen 
q(t,x) und Pt,x,y) durch 

PXuaa- K=01&=%) 


t,x) = lim —— 
a 40 dt 


Plt,a,y) im PX,„<ylK=% Xya—-Xı +0) 
40 


definiert. Die Funktion g(f, x) ist nichtnegativ, und P(t,x,y) ist als Funktion 
von y eine Verteilungsfunktion. Ein Markoffscher Prozeß heißt rein unstetig, 
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wenn er nur sprunghaft Änderungen erfahren kann, und zwar auf. folgende 
Weise: Wenn im Augenblick t der Prozeß sich im Zustand & befindet, dann ist 
die Wahrscheinlichkeit dafür, daß der Prozeß im Augenblick # -- At in einem 
von x verschiedenen Zustand ist, gleich g(f, x) At -+ o(At). Einen rein unstetigen 
Markoffschen Prozeß kann man analytisch folgendermaßen definieren: 

Definition 8.8.1. Ein Markoffscher Prozeß {X,,t€ I} heißt rein unstetig, 
wenn identisch in £ gilt: 


gt, BETEN EN RE, für 2 <y, 
t,x) Plt,x,y) At + o(At) für 2 2=y. 
(8.8.5) 


Fit,x,t+4t,y) = Be 


Die Deutung dieser Gleichung ist einfach: Ist 2 <y, so kann der Prozeß im 
Augenblick + At in einem Zustand kleiner als y sein, wenn er entweder im 
Augenblick £ im Zustand « war und während des Zeitabschnitts [t, + At) 
keine Zustandsänderung erfolgt ist, oder wenn eine Zustandsänderung erfolgt, 
und zwar so, daß sich der Prozeß im Augenblick t + At in einem Zustand kleiner 
als y befindet. It <> y, so kann der Prozeß im Zeitpunkt ? -+ At nur dannin 
einem Zustand kleiner als y sein, wenn eine entsprechende Zustandsänderung 
eintritt. 

Setzen wir Ei, y)=1 für 2 <y, Eis,y)=0 fü 2 >y, 
so können wir die Gleichung (8.8.5) in der folgenden Form schreiben: 


Fl2,t+ 4, y) = gli,z) At] Ele, y) 
+ gl, y) Pli,z,y) At + o(At). (8.8.5) 
Satz 8.8.1. Es sei {[X,0 <t<{oo} ein rein unstetiger Markoffscher Prozeß, 
und es sei P(t,,%,t,,y) eine bezüglich t, und t, steige Bairesche Funktion in x. 


Ferner seien P(t,x,y) und q(t,x) bezüglich t stetige Bairesche Funktionen in x. 
Dann gelten die folgenden Behauptungen: 


1. Die Verteilungsfunktion F(t,, x, er y) genügt den beiden Integrodifferential- 
gleichungen 


OF(t,,%, 1,9%) 


2 =qlt, %) [F (bi, %, bo, Y) 
bı i 


— f Fi, %, t.,y) d, Pit, 2, 2)], (8.8.6) 
m | j 
| 
re EZ 2) d;F(b,, %, b2, 2) 


oo 


+ [alla 2) Pit, 2, y) du Fi, %, 122), (8.8.6) 


Fl, ty) _ 
öt, = 
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2. Die Gleichungen (8.8.6) und (8.8.6') haben unter Voraussetzung der Anfangs- 
bedingungen (8.8.3) und (8.8.4) nur eine Lösung F(t,x,t,%y), welche beiden 
Gleichungen gemeinsam ist und alle Eigenschaften besitzt, die in den Voraussetzungen: 
dieses Satzes festgelegt wurden. 

Wir begnügen uns hier damit, die P=sziehung (8.8.6’) zu beweisen, da der Beweis 
für die Beziehung (8.8.6) völlig analog verläuft. Auf den Beweis der zweiten 
Behauptung verzichten wir überhaupt. Der Leser findet ihn in der Arbeit von 
FELLER [1], von dem auch die vormulierung dieser Behauptung stammt. 

Beweis. Unter Anwendung d«e_ Formeln (8.8.1) und (8.8.5’) .sowie unter 
Berücksichtigung des Wertes von E(2, y) erhalten wir für At, > 0 


© 
Fl,2,1,+4t,y)= [Fl,2,1, +4, y)dR (tw, b, 2) 


= [it - a. DAR 

+ lat, 2) Pliy2,y) Alta] + o(At,)} d.F lt, &, ta, z) 
= Flint y) — At, [ li, 2) du lk,2, 1,2) 

+ ARTA 2) Pit,2,y)d,Fit,,%, 1,2) + o(4dt,). 


Es sei darauf hingewiesen, daß die Existenz sämtlicher hier auftretenden Integrale 
aus den über die Funktionen q und P getroffenen Voraussetzungen folgt. Aus den 
übrigen Gl-ichungen erhalten wir 


lim Ft. %, by + At,, Y) FR Fit, %, bo, Y) 
4,0 A 173 


Y 6) R 
— — [ 42,2) 4, Fit, 2,2) + [ ao 2) Plin2, y)dFlt, 2,122). 


Demnach existiert die rechtsseitige Ableitung. 
Wiederholen wir diese Überlegung für At, < 0, so erhalten wir die linksseitige 
Ableitung, die sich als der rechtsseitigen gleich erweist. Daraus folgt die Existenz 


der Ableitung = F(t,,%,t,,y). Ferner sieht man, daß diese Ableitung durch 
2 . 


(8.8.6’) gegeben ist. 

Die Gleichung (8.8.6) heißt retrospektive Gleichung; sie wurde von FELLER [1] 
hergeleitet. Die Gleichung (8.8.6’) wurde (unter etwas anderen Voraussetzungen) 
von KoLMoOGoROFF [3] hergeleitet und heißt prospektive Gleichung. 
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€. Wir kommen nun zur Behandlung eines rein stetigen Prozesses. 


Definition 8.8.2. Ein Markoffscher Prozeß {X,,t € I} heißt rein stetig, wenn 
für jedes GE I undjedes e>0 die folgenden Beziehungen gelten: 


lim > ji (y—-z)?d,Fi,x,i+4At,y)=0, (8.8.7) 
d—0 A 

w-al2e 
lim 5 y—e)d, Fi,x,t+ At,y) =mit,«), (8.8.8) 
dt>0 A i 

Iv»-zi<e 
lin 4, f (y— a)2d, Pli,x,t + At, y) = 02,2) > 0. (8.8.9) 
4t>0 

»—z!<e \ 


Dabei soll die Konvergenz in den letzten beiden Beziehungen gleichmäßig in x 
sein. Die Größe At kann beliebiges Vorzeichen haben. 

Existiert die Dichtefunktion f{t,, x, tz, y), so nehmen die oben angegebenen 
Formeln die folgende Gestalt an: 


lim en f (y- ea” ft,w,t+A,y)dy=0, (8.8.7) 
dt>0 At 

w-elze 
lim 24 f y-a)fla,t+ At,y)dy=mi,x), (8.8.8°) 
a0 At 

Iv-2|<e 
lim a (y— 2,4 dt,y)dy = orlt,x)>0. (8.8.9') 
ao At 

v—-az]<e 


Wir bemerken, daß sich aus (8.8.7) 


lim en farwsı+2u y)=0 
y-zl2e 

ergibt, während aus (8.8.7) und (8.8.9) 

oo 


lim Kr (y— z)d,Fl,x,t-+ At,y) = 0?(t,x) > 0 
ao At 


folgt. Die letzten beiden Formeln schreiben wir in der Gestalt 


P(lX4n—- KılZelX, =x) = o(At) (8.8.10) 
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bzw. 
EllXyra — X] = ®] = 02lt, ©) At + 0(At). (8.8.11) 


Nach (8.8.10) ist die Wahrscheinlichkeit einer wesentlichen Zustandsänderung 
während eines kleinen Zeitintervalls sehr klein, und zwar von kleinerer Ordnung 
als At, und nach (8.8.11) ist, wie klein auch At ist, die Wahrscheinlichkeit dafür, 
daß X, — X: #0 ist, positiv. Hier ist es umgekehrt wie bei einem rein un- 
stetigen Prozeß. Dort war die Wahrscheinlichkeit, daß in einem kleinen Zeit- 
abschnitt eine Zustandsänderung auftritt, klein; erfolgt aber eine Änderung, so 
kann sie groß sein. ; 


D. Die in 8.3 bis 8.6 betrachteten Prozesse waren rein unstetig. Die Realisierungen 
dieser Prozesse wurden durch Treppenfunktionen dargestellt; es gibt aber auch 

“rein unstetige Prozesse, deren Realisierungen bedeutend kompliziertere Funktio- 
nen sein können. Die Bezeichnung ‚rein stetige Prozesse‘ legt die Annahme 
nahe, daß die Realisierungen dieser Prozesse immer stetige Funktionen sind. Das 
ist in den meisten Fällen so, aber nicht immer. In 8.12 werden wir dieser Frage 
einige Bemerkungen widmen. 


89. Der Wienersche Prozeß 


Wir wollen uns jetzt mit einem rein stetigen Prozeß befassen, der große theoretische 
Bedeutung hat und viele physikalische Anwendungen besitzt. 

Es sei {X,0<t<<oo} ein Markoffscher Prozeß, dessen mögliche Zustände 
alle reellen Zahlen sein sollen. Wir setzen voraus, daß der Prozeß rein stetig ist 
und daß für beliebige r und { (sr <t <oo) die bedingte Verteilungsfunktion 
F(r,&,t,y) die Form F(r,t,u) mit v=y— x hat. F(r,t, w) ist also die Wahr- 
scheinlichkeit dafür, daß der Zuwachs in der Zeit von r bis t kleiner als « ist. 
Die Funktion F(r, t, «) ist nach Voraussetzung stetig in t und 7 und hat die Dichte- 
funktion f(r, t, w). Die Beziehungen (8.8.2) bis (8.8.4) haben hier die Form 


I@; t, u) = te, 9,U— w) f(s, t, w) dw, (8.9.1) 


70 


wobei r<s<# ist, 


für u < 
EEE (8.9.2) 
1>t 1 fü u>0; 


Se (8.9.3) 


lim F(r,t, u) = NE 


it 


ie für u<0, 
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während die Beziehungen (8.8.7) bis (8.8.9) die Gestalt 


lim >: arf(t,t + At,u)du=0, (8.9.4) 
a0 At 

lulze 
lim e4 few t+ At,u)du =mii), (8.9.5) 
a0 At 8 

lal<e 
lim 2 fer t+ At, u)du = o2ft)>0 (8.9.6) 
4t—0 At 

lul<e 


haben; dabei ist e>0 beliebig. 
Wir nehmen außerdem an: 


(A) Für alle r, t und % existieren die partiellen Ableitungen 


oft, t, u) ft, t, w) 
du ou? 


und sind stetig in allen Argumenten; außerdem ist für jedes feste t (oder r) die 
92 
Ableitung - gleichmäßig stetig und gleichmäßig beschränkt bezüglich «. 
w 


Satz 8.9.1. Essei (X, 0 <t<oo} ein Markoffscher Prozeß, für den die Formeln 
(8.9.1) bis (8.9.6) sowie die Voraussetzung (A) gelten. Die Dichtefunktion F(r,t, u) 
erfüllt dann die folgende partielle Differentialgleichung zweiter Ordnung vom para- 
bolischen Typus: 


ds: 
et 


1 02 
— 02 (f) u (8.9.7) 


I 


Sl 
"0,,r32 


Beweis. Wir schreiben (8.9.1) in der Form 
I@,t Ha Lu) = 1113 tu — w) fit, 5 + At, w) dw (8.9.8) 
und entwickeln /(r, t, u — w) in eine Taylorsche Reihe: 
A Li 


Iabu-W)=-IabW)-w + en 


ze llza] = V0<P<1). 
2 u—dw 


ou2 ou? 
(8.9.9) 
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Diese Entwicklungen setzen wir in (8.9.8) ein und erhalten 


fat + Alu) _1 "2 [nern 


At 
of 
en +4 91 
Dur fers +4t,w) dw (8.9.10) 
1 1 f 1 
ae 1, + At, w)dw+ — J 
MERTIT fer en 
wobei 
ef 02f 
J= —_ — le +At,w)d 8.9.11 
fe als; zul + At, u) dw (89.11) 
ist. Wir bemerken, daß 
[tat + At, w)dw=1 (8.9.12) 


ist. Ferner folgen aus den Formeln (8.9.4) bis (8.9.6) die Gleichungen 


\ oo 
lim E wiit,t + At,w) dw 
a0 Ab 
= lim ae wf(t,i + At,w)dw =m(t), (8.9.13) 
40 A t ‚ 
lwl<e 
oo 
lim 2, wef(tt,t + At,w) dw 
40 At 
= lim An weflt,t + At, w) dw = o2(t). (8.9.14) 
40 u 


Wir spalten das Integral J in zwei Integrale J, und J, auf: 


[le 
J, = wr I | — ft,t+4t,w) dw, (8.9.15) 
du? u—dw 
lwl<e 
= o2f o2f 
de fl]. a At, u)dw. (8.9.16) 


lwl2e 
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Auf Grund der Voraussetzung über die gleichmäßige Stetigkeit der Ableitung 
92 
Z in % kann der Ausdruck in der geschweiften Klammer von (8.9.15) für jedes 
u 


At beliebig klein gemacht werden, wenn s genügend klein ist. Daraus folgt J, 
2 

= o(4t). Wegen der gleichmäßigen Beschränktheit der Ableitung . in u 
u 

und auf Grund der Formel (8.9.4) erhalten wir, daß auch J, = o(At) gilt. Also ist 


J=o(At). (8.9.17) 


Setzen wir in (8.9.10) die Formeln (8.9.12) bis (8.9.14) und (8.9.17) ein, so sehen 
wir, daß die rechtsseitige Ableitung = existiert; der analoge Schluß gilt für 


At<0. Also existiert die Ableitung a . Durch leichte Umformung erhalten 


wir die prospektive Gleichung (8.9.7) (vgl. 8.7). Die retrospektive Gleichung kann 
man ebenfalls herleiten. Sie hat die Form 


ff 1 


Qi K23 
Or ou 2 


= —m(t) 02 (?) Z L (8.9.18) 


BACHELIER [1] fand die Gleichungen (8.9.7) und (8.9.18), gab aber keinen exak- 
ten Beweis an. Die Gleichungen stellen einen Spezialfall von Gleichungen dar, die 
von KOLMOGOROFF in [3] für rein stetige Prozesse hergeleitet wurden. 


Um die Dichtefunktion f(r, t, u) zu bestimmen, setzen wir 


® = u — (mia) de, 
t 
t* = o?(&) da 


T 


(8.9.19) 


und bezeichnen mit g(r, t*, v) die neue Dichtefunktion. Dann erhalten wir wegen 


au =1 nach (2.4.10) 
v 


9%, 5*,v) = Flr, t(i*), u, i*)], 


wobei £(£*) und #(v, t*) die Umkehrung der Transformation (8.9.19) ist. Aus der 
letzten Gleichung und der Formel (8.9.7) ergibt sich 


1 
ee i 8.9.20 
2 
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Wenn wir ganz analog vorgehen, liefert (8.9.18) 
1 

a, 8.9.21 
- | (8.9.21) 


Wir haben die Wärmeleitungsgleichungen erhalten. Die einzige Lösung dieser 
Gleichungen, die eine Dichtefunktion ist und (8.9.1) bis (8.9.6) erfüllt, ist die 
Funktion (vgl. CouRANT und HiLeerr [1]) 


gr,tF,v)= 


Vonr exp (- sn) (8.9.22) 


Wenn wir 


t 
M(r,t)= f m(c) de, B’(r,t) =1t* 


setzen, erhalten wir 


I@, t, u) = 


u [u = Mn, 9) 2 (8.9.23) 


Br, t)Y2r = | 2B?(t,t) 


| Der Zuwachs X, — X, ist also normal verteilt und hat den Mittelwert M (r, t) 
| und die Standardabweichung B (7, t). Da für beliebige 
| tan (Sh<b<--<tn< oo) 
die Gleichung 
B?(tı, 6a) - IB (bi, +1) 


erfüllt ist, hat der betrachtete Prozeß unabhängige Zuwächse. 


Wir wollen jetzt den folgenden Spezialfall eines solchen Prozesses betrachten: 
Die Zuwächse seien unabhängig und homogen, und der Mittelwert der Zuwächse 
sei identisch gleich Null. Es ist also 


Me)=0, P(r,)=(t — ro? 
Die Formel (8.9.23) hat hier die Gestalt 


u? 
A t, u) = Vorl.) exp I- Teer] . (8.9.24) 


Wir wählen insbesondere 7 =0 und setzen voraus, daß P(X, = 0) =1 ist. 
Dann ist X, der Zuwachs in dem Intervall [0, i). Die Dichtefunktion f{t, v) der 
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Zufallsvariablen X, hat die Gestalt 


| el 
ft, «) = eyazi exp | ee) (8.9.25) 


Definition 8.9.1. Einen Prozeß !X,0<t< oo}, der der Gleichung 
P(X,=0)=1 genügt, homogene und unabhängige Zuwächse hat und dessen 
Zufallsvariabie X, die Dichtefunktion (8.9.25) besitzen, nennt man Brownschen 
Bewegungsprozeß oder Wienerschen Prozeß. 

Woher diese Namen kommen, wollen wir im weiteren Verlauf dieses Kapitels 
erklären. 

Für den Wienerschen Prozeß ist also 


1. PX =0)=1, 
2. BR, X)=0, (8.9.26) 
3. D(X,— X)=(t-- 2)o8. 


wobei z und E(O<r<t) beliebig sind. Weiter ist für beliebige rn = 2,3, 4, ... 
und beliebige Parameterwerte 1; ( =1,2,...,n), wobei ih << 1, ist, 


X, = Ku + (X, sl X,) + ar (X, == Ku.) 


Die Zufallsvariablen X,, X, — X: X. — X;,_, sindunabhängig und normal 
verteilt. Die Zufallsvariablen X,,X,,..., X, haben als lineare Funktionen 
normal verteilter unabhängiger Zufallsvariabler nach Satz 5.11.1 eine gemeinsame 
Normalverteilung. Dabei ist 


E(X,)=0, DM(X,) =to @=1,...,R), 
E(X,X,)=t® (j=12,..,n; i< 3 

Die Matrix M der Momente zweiter Ordnung der Zufallsvariablen 
Ks X) 


hat die Form 


A 3 
M Ihe tz 
or bat 

la 


Beispiel 8.9.1 (Brownsche Bewegung). In einer Flüssigkeit führt ein mikroskopisches 
Teilchen unter dem Einfluß der Stöße der Flüssigkeitsmoleküle Bewegungen aus. Diese 
Erscheinung beobachtete BrRows im Jahre 1826. Wir betrachten die Bewegung eines solchen 
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Teilchens und bezeichnen mit X, seine Abszisse im Augenblick i#. Wie Einstein [1] und 
SMOLUCHOWSKI [1]. zeigten, wird eine gute Annäherung erzielt, wenn man X, als Brownschen 
Bewegungsprozeß auffaßt. Das erklärt sich im wesentlichen daraus, daß Kontakte zwischen 
dem untersuchten Teilchen und den Flüssigkeitsmolekülen nur im Augenblick des Zusammen- 
stoßes auftreten. Die Stöße erfolgen unregelmäßig und häufig. Ist die Differenz t—r im 
Verhältnis zur Zeit, die zwischen zwei aufeinanderfolgenden Stößen vergeht, groß, dann kann 
der Zuwachs X, — X, als Summe vieler kleiner Zuwächse betrachtet werden. Befindet sich 
die Flüssigkeit im makroskopischen Gleichgewicht, dann kann man annehmen, daß erstens 
die Zuwächse nur von der Länge des Zeitabschnittes abhängen, also homogen sind, und zwei- 
tens Zuwächse in disjunkten Intervallen unabhängig sind. Weiter nehmen wir an, daß die 
Bewegung symmetrisch ist, also E(X, — X,)=0. EINSTEIN zeigte, daß 


EUX, — X,)?] = 2D8t 


ist, wobei D die Diffusionskonstante der Flüssigkeit ist. Also ist «0? = 2.D? eine für die Flüssig- 
keit charakteristische Größe. Wir können alle Voraussetzungen, die zum Brownschen Be- 
wegungsprozeß führten, als erfüllt ansehen und annehmen, daß ein derartiger Prozeß vorliegt, 
‚was auch durch Beobachtungen bestätigt wird. 

Wie wir schon oben ausführten, können wir X, — X, als Summe von vielen unabhängigen 
Zufailsvariablen betrachten. Auf Grund des zentralen Grenzwertsatzes liegt es also auch 
nahe zu vermuten, daß X, — X, eine Normalverteilung hat. 

Die Bewegung von Gasmolekülen bei niedrigem Druck kann ebenfalls als Brownsche 
Bewegung angesehen werden. Allgemein kann als Brownsche Bewegung die Bewegung 
eines Körpers in einem Medium betrachtet werden, wenn die Ausdehnungen dieses Körpers 
mikroskopisch klein im Verhältnis zu den Ausdehnungen des Mediums und zu den anderen 
Elementen sind, die sich darin befinden, und wenn Berührungen dieses Körpers mit den 
Elementen des Mediums plötzlich erfolgen und vom Zufall gesteuert sind. So können wir 
zum Beispiel als Körper einen „kleinen“ Stern betrachten, d.h. einen Stern, dessen Ausdeh- 
nungen klein sind im Verhältnis zu den anderen Sternen, die sich im kosmischen Raum be- 
finden. Hierbei spielt der kosmische Raum die Rolle der Flüssigkeit, in der die Brownsche 
Bewegung stattfindet. Unter einem ‚Stoß‘ verstehen wir, daß sich der Stern im Kräftefeld 
anderer Sterne befindet. Die Bahn eines solchen „kleinen‘‘ Sterns ist vom Zufall abhängig, 
und zu ihrer Beschreibung kann man das Modell eines Brownschen Bewegungsprozesses 
heranziehen. j 


Beispiel 8.9.2. In Beispiel 5.11.1 betrachteten wir die Geschwindigkeit eines Moleküls in 
einem idealen Gas und stellten fest, daß jede Komponente des Geschwindigkeitsvektors 
normal verteilt ist. Zu demselben Ergebnis kommt man, wenn man das Modell des Brownschen 
Bewegungsprozesses anwendet. Die Durchführung der entsprechenden Überlegung überlassen 
wir dem Leser. 


Zum Abschluß des Paragraphen bemerken wir noch, daß die von uns betrach- 
teten Prozesse mit unabhängigen und homogenen Zuwächsen, nämlich der 
Poissonsche Prozeß, der Geburtsprozeß und der Wienersche Prozeß, Spezialfälle 
der umfangreichen Klasse der Prozesse mit unabhängigen und homogenen Zuwäch- 
sen sind. Hier begnügen wir uns damit, den Leser auf die Arbeiten von CRAMER [1], 
DE Fınermi [1], Levy [2] und KoLMoGoroFF [5] zu verweisen. 

Es sei erwähnt, daß viele Verallgemeinerungen des Prozesses der Brownschen 
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Bewegung (auf den mehrdimensionalen Fall und auf andere Fälle) untersucht 
worden sind. Hier seien nur zwei Arbeiten genannt, und zwar die von Lävy [11] 
und die von Irö [1]. 


8.10. Stationäre Prozesse 


A. Jetzt wollen wir uns kurz mit einer Klasse von Prozessen beschäftigen, die man 
als stationäre Prozesse bezeichnet. Die Theorie dieser Prozesse hat sich in der 
jüngsten Zeit entwickelt und fand immer zahlreichere Anwendungen. Zunächst 
wollen wir einige allgemeine Bemerkungen machen. Stationäre Prozesse haben die 
Eigenschaft, daß die Wahrscheinlichkeitsverteilung oder zumindest manche 
Momente der Zufallsvariablen des Prozesses von einer Verschiebung des Anfangs- 
punktes auf der Zeitachse # unabhängig sind. Die Klassen der Markoffschen Pro- 
zesse und der stationären Prozesse schließen sich nicht gegenseitig aus. Manche 
Markoffschen Prozesse sind stationäre Prozesse, obwohl andererseits viele Zufalls- 
erscheinungen in der Industrie, in der Meteorologie, in der Ökonomie und in ande- 
ren Gebieten dem Modell des Markoffschen Prozesses nicht genügen, sich aber 
dafür mit Hilfe der Theorie der stationären Prozesse erfassen lassen. 


B. Im folgenden werden wir komplexe Zufallsvariable betrachten müssen, die 
wir nunmehr definieren wollen. 


Definition 8.10.1. Es seien X und Y reelle Zufallsvariable im Sinne der Defi- 
nition 2.1.2. Dann bezeichnet man mit Z= X +17 (ti ist die imaginäre Einheit) 
eine komplexe Zufallsvariable. 

Die Verteilung der Zufallsvariablen Z wird durch die zweidimensionale Ver- 
teilungsfunktion F(xz,y) =P(X <xz, 7 <y) bestimmt. 


Definition 8.10.1’. Es seien {X,tel} und {Y„tEe/} reelle stochastische 
Prozesse im Sinne der Definition 8.1.1, undessi ,= X, +:Y,(tEI). Dann 
nennt man {Zt € I} einen komplexen stochastischen Prozeß. 


Definition 8.10.2. Den Ausdruck 
D?(Z) = E(lZ — E(Z)|?) 


nennt man die Varianz der komplexen Zufallsvariablen 2. 
Wie der Leser selbst verifizieren kann, gilt 


D?(Z) = E(lZ]%) — |E(Z)? = DM(X) + D%(Y). 
Definition 8.10.3. Den Ausdruck 


{tz, - 221 - FZ]} 


94 Fisz 
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nennt man die Kovarianz der komplexen Zufallsvariablen Z, und Z,, der u R0m2S: 
nenten des Vektors (Z,, Z,). 

Es sei hier darauf hingewiesen, daß im Gegensatz zum reellen Fall die Kovarianz 
der Komponenten des Vektors (Z,,Z,) nicht gleich der Kovarianz des Vektors 
(Z,, Z,) ist. 

6. Wir wenden uns nun der Definition eines stationären Prozesses zu. 

Definition 8.10.4. Ein stochastischer komplexer Prozeß {Z, — © <t< oo} 


heißt stationär im engeren Sinne, wenn für n=1,2,... und für beliebige reelle 
„ti, und r die Gleichung i 
Fu. la een Em 9 Yo) (8.10.1) 
= P(X, <a,.., X, < Um Ya < Yn 5 Yu < Yn) 
= PX, <y Aa < m Yarı < Yan 5 Insı < Yu) 
= Fatn cn. Inte (E15 +45 Uns Yan +++» Yn) 


erfilit ist. 
Ein reeller Prozeß {X, —0o <t< oo} heißt stationär im engeren Sinne, 
wenn für die betrachteten 2, i,, ..., f„ und r die Gleichung 


Pins) Ba ei) (8.10.1’) 
gilt. 

Aus dieser Definition folgt insbesondere, daB Fı(&,y) = Fır(&, y) = Fr(&,Y) 
für jedes reelle t und daß F,(x) = F,(x) für einen reellen Prozeß gilt. Somit 
haben alle Z, (im. reellen Fall alle X,) die gleiche Verteilung. 

Alle zweidimensionalen Verteilungsfunktionen sind nur von der Differenz der 
Werte des Parameters £ abhängig, und zwar gilt 


Ft (&1: %e> Yu, Ya) = F,, et (%1 X: Yı, Ya) 
bzw. für reelle stationäre Prozesse 
Ft (21, &) = F,ua_n (Cı %e)- 


Wenn die Momente zweiter Ordnung der Zufallsvariablen X, und Y, existieren 
und ,=X,-+iY, ein stationärer Prozeß im engeren Sinne ist, dann gelten 
wegen (8.10.1) für alle.reellen t und 7 die Gleichungen 


E(Z) =E(X,-+iY,) = m, + im, = m — const, 


D2(Z,) = D2(X,) + D2(Y,) = 0? = const, (8.10.2) 


Bltz,,. — BZ. -B@} = Ri. 
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Die Funktion R(r) heißt Korrelationsfunktion. Wie man leicht sieht, eilt 


R(0) = D2(Z)) und R(—r) = R(r). Für reelle Prozesse gehen die Formeln 
(8.10.2) über in 


E(X)=m= Sankt, 
D2(X,) = 0? = const, (8.10.2’) 
En ER - EIN = RO. 


Liegt ein reeller Prozeß vor und ist hierbei m =0 und 0? =1, so ist R(r) ein- 
fach der Korrelationskoeffizient der Zufallsvariablen X, und X,,.. 


Beispiel 8.10.1. Es bezeichne X, die Temperatur eines festgewählten Punktes in der 
Atmosphäre zur Zeit i. Wir betrachten die Temperaturschwankungen in kleinen Zeit- 
abschnitten, so daß es sich um sehr kleine Temperaturschwankungen turbulenten Charakters 
handelt. Diese Schwankungen verursachen senkrechte Wärmebewegungen und haben be- 
deutenden Einfluß auf den Verlauf vieler meteorologischer Erscheinungen. Man kann nicht 
annehmen, daß X, ein Markoffscher Prozeß ist, da die Temperatur des Punktes zur Zeit t, 
nicht die Wahrscheinlichkeitsverteilung der Zufallsvariablen X, für #> t, bestimmt. Diese 
Verteilung hängt auch von der Temperatur in früheren Augenblicken ab; denn die Intensität 
der lokalen Temperaturschwankung ist z. B. in den einzelnen Jahreszeiten verschieden. Aber 
man kann bei beständigem Wetter annehmen, daß X, ein stationärer Prozeß ist. Die Beob- 
achtungen der lokalen atmosphärischen Temperaturschwankungen wurden mit einem 
Mikrothermometer durchgeführt, dessen Konstruktion KRETSCHMER [1] angegeben hat. Wir 
haben die beobachtete Realisierung des Prozesses X, in Abb. 8.10.1 dargestellt. 


Abb. 8.10.1 


Besonders wichtig ist der normale stationäre Prozeß, d.h. ein stationärer 
Prozeß, der den Beziehungen (8.10.2°) mit m =0 und o—1 genügt und der 
die Eigenschaft hat, daß für n =1,2,3,.... und beliebige i„(m =1,2,...,r) die 
Zufallsvariable (X, ..., X,,) normal verteilt ist. Der Formel (5.11.9) entnimmt 
man, daß (X X,,) dann die charakteristische Funktion 


en 
1 n n 
Du 


Rit, — t,) 2 


1i=1 
hat. 


24* 
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In den Anwendungen ist es gewöhnlich schwierig, mehrdimensionale Verteilun- 
gen der Zufallsvariablen X, zu untersuchen. Vielfach kann man aus dem Beob- 
achtungsmaterial nur die Momente der Zufallsvariablen berechnen. Diesem Tat- 
bestand wollen wir die ln 5 eines stationären Prozesses im weiteren 
Sinne anpassen. 

Definition 8.10.5. Ein komplexer Prozeß (Zu — oo <t< oo} heißt ein 
stationärer Prozeß im weiteren Sinne (oder im Chinischinschen Sinne), wenn die 
Erwartungswerte, Varianzen und Kovarianzen der Zufallsvariablen dieses Pro- 
zesses existieren und den Gleichungen (8.10.2) genügen. Ein reeller Prozeß 
{X, — oo <f< oo} heißt stationär im weiteren Sinne, wenn seine Zufallsvariablen 
endliche Momente erster und zweiter Ordnung besitzen und den Beziehungen 
(8.10.2') genügen. 

Aus dieser Definition geht hervor, daß ein stationärer Prozeß im engeren Sinne, 
der Momente zweiter Ordnung besitzt, ein stationärer Prozeß im weiteren Sinne ist. 
Offenbar ist der in diesem Abschnitt betrachtete reelle normale Prozeß stationär 
sowohl im engeren als auch im weiteren Sinne, 


D. Wir wollen nun den Begriff der Stetigkeit eines stationären Prozesses einführen. 
Definition 8.10.6. Ein Prozeß {Z,, — oo <t<- oo}, der stationär im weiteren 
Sinne ist, heißt stelig, wenn für jedes reelle i 


im Z([Z,,,. — 49) =0 (8.10.3) 
0 5 
gilt. 

Satz 8.10.1. Bine notwendige und hinreichende Bedingung dafür, daß ein im 


weiteren Sinne stationärer Prozeß stetig ist, ist die Stetigkeit seiner Korrelations- 
funktion R(r) an der Stelle = =. 


Beweis. Der im weiteren Sinne stationäre Prozeß {Z, —oo <t< oo} sei 
stetig. Unter Berücksichtigung der Gleichungen (8.10.2) erhalten wir nach ein- 
fachen Umformungen 


IR@+A)- Rei= El2,.- DaB Wi. 
<#{\(2..- [4 -2]}. 
Auf Grund der Schwarzschen Ungleichung (vgl. etwa FicHTex#orz [1]) erhalten 
wir 
B{\2.,.- 2% 8%] |} (8.10.5) 
<YE(Z,..— Z,)EIZ, — EZ). 
Wegen D2(Z,) < oo liefern die Beziehungen (8.10.3), (8.10.4) und (8.10.5) 
lim |R( +4) — Re)| =0, (8.10.6) 


d—>0 


und die Funktion R(r) ist somit stetig. 
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Nun sei R (7) stetig an der Stelle = 0. Da es sich um einen stationären Prozeß 
handelt, haben wir 


BilZ.,. — 29 = B{IZ, — B(Z) — 12, — BZ] 
= BLIZ, — B(Z)?) + BLZ, — BZ] 
— B {[Z, — B(2,1|2.- 7} 
- E{12, - 221, zZ] 
= 2D%(Z,) — Re) - Rn). 


Wegen R(0) = D%(Z,) und der vorausgesetzten Stetigkeit der Funktion 
R(r) an der Stelle r=0 erhalten wir aus den letzten Gleichungen 


im B(Z,.- 29 =0, 
0 


und der betrachtete Prozeß ist somit stetig. 
Für das weitere wollen wir annehmen, daß in den Gleichungen (8.10.2) und 
(8.10.2°) stets 


m—t, o=1 (8.10.7) 
gilt. 
Nun wollen wir einen von CHINTSCHIN [3] bewiesenen Satz kennenlernen, der 
für die Theorie der stationären Prozesse von fundamentaler Bedeutung ist. 


Satz 8.10.2. Eine notwendige und hinreichende Bedingung dafür, daß R(r) 
Korrelationsfunktion eines im weiteren Sinne stationären stetigen Prozesses 
{Z, —oo <t<o0} ist, der den Beziehungen (8.10.7) genügt, ist die Existenz 
einer Verteilungsfunktion F mit der Eigenschaft, daß 


R(r) = fe dr (2) (8.10.8) 


gilt. 


Beweis. Es sei R(r) Korrelationsfunktion des betrachteten stationären Prozes- 
ses. Aus (8.10.2) und (8.10.7) folgt dann 


RO) =1. | | (8.10.9) 


Ferner haben wir für » = 1,2, ... und beliebige reelle t,,...,i„ sowie komplexe 
@1, ...,% die Beziehung 


B Rt; — 4)a;0, = -£ 0,;%,E (Z,-2o 0) 


jk=1 


n on 
= 2 a;%,E(Z,2,) =E | 
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und somit ist R(r) eine positiv definite Funktion. Beachten wir schließlich 
(8.10.9) sowie die Tatsache, daß R(r) auf Grund des Satzes 8.10.1 stetig ist, so 
folgt nach Satz 4.1.1 die Existenz einer Verteilungsfunktion F (A), die der Beziehung 
(8.10.8) genügt. 

Nun möge R(r) der Beziehung (8.10.8) genügen, wobei F(A) eine Verteilungs- 
funktion bedeutet. Wir müssen die Existenz eines im weiteren Sinne stationären 
stetigen Prozesses [Z, — © <t << 00} nachweisen, der den Gleichungen (8.10.7) 
genügt und dessen Korrelationsfunktion die gegebene Funktion R(r) ist. Zum 
Beweis genügt es offenbar, ein Beispiel eines solchen Prozesses anzugeben. Der 
Einfachheit halber wollen wir uns mit dem Fall begnügen, daß R(r) eine reelle 
Funktion ist. Ein Beispiel für einen solchen Prozeß ist der reelle stationäre nor- 
male Prozeß, den wir in 8.10.C betrachtet hatten. Sämtliche endlichdimensionalen 
Verteilungen dieses Prozesses, d. h. Verteilungen der Vektoren {X , I +. X} 
für beliebige » und f; fa, ..., f„ sind durch die Matrix der Momente zweiter Ord- 
nung bestimmt, die ihrerseits durch die Korrelationsfunktion R(r) eindeutig be- 
stimmt sind. 


Damit ist der Satz bewiesen. 


Der Leser wird bereits festgestellt haben, daß bei einer Normierung gemäß 
(8.10.7) die Korrelationsfunktion R(r) auf Grund des Satzes 8.10.2 sämtliche 
Eigenschaften einer charakteristischen Funktion besitzt. 

Die in (8.10.8) auftretende Funktion F'(A) führt die ans spektrale 
Verteilungsfunktion. Aus dem Satz 4.5.1 folgt, daß die Korrelationsfunktion 
R(r) die spektrale Verteilungsfunktion F(A) eindeutig bestimmt. 

Existiert eine Dichtefunktion f{A), so heißt der zugehörige stationäre Prozeß 
ein Prozeß mit stetigem Spektrum. Falls hierbei R(r) eine absolut differenzierbare 
Funktion auf der gesamten 7-Achse ist (— oo << oo), läßt sich die Spektral- 
dichte f{}) aus der Beziehung (4.5.6) ermitteln, die nunmehr die Gestalt 


oo 


fa) ei ferroa 
27 


x 


annimmt. 

Weist die spektrale Verteilungsfunktion F(A) Zunahmen nur an den Sprung- 
stellen A, auf, so bezeichnet man den zugehörigen Prozeß als einen Prozeß mit 
diskretem Spektrum. Wir sagen, daß (8.10.8) eine Spektraldarstellung der Korre- 
lationsfunktion liefert. 


E. Wir betrachten den durch 


— J7Wy ein (8.10.10) 


k=1 
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definierten Prozeß {Z, — oo <E# << oo}, wobei die A, reelle Konstanten und die 
W,(k=1,2,...,n) komplexe Zufallsvariable sind, die den Gleichungen 


EW)=0, E{lW.) = 0, 
(8.10.11) 
EW.W)=0 (k=#j) 


genügen; hierbei gilt %>0 (k=1,...,n) und Yo=1. Die letzte der 


k=1 
Gleichungen (8.10.11) besagt, daß die Variablen W,. nicht korreliert sind. 

Der Prozeß {Z, —oo <t< oo}, der durch die Gleichung (8.10.10) definiert 
ist, stellt eine Überlagerung von % .periodischen Schwingungen mit zufälliger 
Amplitude und zufälliger Phase dar. Wir setzen W, = U, +:V/,, wobei U, und 
V, rcell sind. Der Realteil des Ausdrucks W,e®*' ergibt sich dann zu 


U, cos Art = V, sin. Art = Rı sin (Art + &x) 
mit 

R. = YU? + v3, ee 8%, = ——. 

Rr Rı 
Das ist eine Sinuskurve mit der konstanten Frequenz },, der zufälligen Amplitude 
R, und der zufälligen Phase «,. Somit ist der Realteil des Prozesses Z, eine Über- 
lagerung solcher Sinuskurven. 
Der durch (8.10.10) definierte Prozeß Z, ist ein stationärer stetiger Prozeß im 

weiteren Sinne und genügt den Gleichungen (8.10.7). In der Tat, wegen (8.10.10) 
und (8.10.11) erhalten wir 


E(Z,) En Ö, 
D2(Z,) = E(2,9 - 20 4, 
-=1 


R(r) = E(Z,,.2) (8.10.12) 


—E P3 Weit [£ Wert 
k=1 k=1 


a gamnwef > 2 = . 
= | ZW, Me) — Yolei. 
k=1 k=1 


Damit ist gezeigt, daß der Prozeß ein stationärer Prozeß im weiteren Sinne ist 
und den Gleichungen (8.10,7) genügt. Seine Stetigkeit folgt aus der Stetigkeit der 
Funktion & (7). 

Die Verteilungsfunktion F(A), die gemäß (8.10.8) der durch (8.10.12) gegebenen 
Korrelationsfunktion R(r) entspricht, ist eine stückweise konstante Funktion, 
die nur in den Punkten A, mit den jeweiligen Sprunghöhen o; anwächst. Der 
betrachtete Prozeß hat somit ein diskretes Spektrum. 
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Es läßt sich leicht zeigen, daß ein reeller Prozeß mit einer Korrelationsfunktion 
der Form 


m 
R(r) = 2 J/0% 608 Ayr 
»=1 


vorliegt, wenn n = 2m ist und hierbei 2m Summanden der Summe a) 
m konjugiert komplexe Paare bilden. 


F. Der durch (8.10.10) definierte Prozeß bildet den Ausgangspunkt für die har- 
monische Analyse der stationären stochastischen Prozesse. Um wenigstens eine 
grobe Information über das Wesen dieser Problemstellung zu vermitteln, müssen 
wir eine neue Art der Konvergenz einführen, die mit dem in der Definition 8.10.6 
gegebenen Stetigkeitsbegriff in Zusammenhang steht. 


Definition 8.10.7. Eine Folge (komplexer oder reeller) Zufallsvariabler {U}, 
die Momente zweiter Ordnung besitzen, nennt man im quadratischen Mittel 
konvergent gegen die Zufallsvariable U, wenn die Bedingung 

lim Z(\U,„—- U) =0 (8.10.13) 
Nn>X 
erfüllt ist. 
Wir betrachten nun den durch die Formel 


n © 
Zr — lim Wett = DWye! (8.10.14) 
n>00 k=1 k=1 


definierten Prozeß {Z, —oo <t< 00}, wobei die W, (k=1,2,...) komplexe 
Zufallsvariable sind, die den Gleichungen (8.10.11) und darüber hinaus der Glei- 
chung 


I;=1 (8.10.15) 


genügen. Der Grenzübergang in (8.10.14) ist hierbei im Sinne der Definition 
8.10.7 zu verstehen. Es läßt sich zeigen, daß dieser Grenzwert existiert (siehe etwa 
Doog [5], Kap. IV, $ 4). 

Der Prozeß Z, ist stationär im weiteren Sinne, und seine Korrelationsfunktion 
R(r) hat die Form 


Rx) = Sofeüw, (8.10.16) 
k=1 R 


SLUTSKI [3] hat gezeigt, daß jeder stetige, im weiteren Sinne stationäre Prozeß 
mit diskretem Spektrum sich in Form der auf der rechten Seite von (8.10.14) 
auftretenden Reihe darstellen läßt. Das ist ein Spezialfall des Satzes über die 
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Spektraldarstellung stationärer Prozesse. Einen allgemeineren Satz über die Spek- 
traldarstellung stationärer Prozesse, der Prozesse mit kontinuierlichem Spektrum 
umfaßt und in dem die auf der rechten Seite von (8.10.14) stehende 
Reihe durch eigens für diesen Zweck definierte Integrale zu ersetzen sind, hat 
KOLMOGOROFF bewiesen [10], [11]. Den Satz für den in 8.10.C betrachteten nor- 
malen stationären Prozeß haben Kac und SıEsERT [1] formuliert; sie haben eine 
effektive Formel gefunden, die X, in Form einer Reihe darstellt. Sätze über die 
Spektraldarstellung von Prozessen (ohne die Voraussetzung, daß diese stationär 
sind), deren Zufallsvariable endliche Momente zweiter Ordnung besitzen, haben 
Lokve [1], [2], KARHUNEN [1], CRAMER [6] und GETooR [1] angegeben. 


6. Wir wollen nun einige Betrachtungen der Interpretation einer spektralen Ver- 
teilungsfunktion in physikalischen Problemen widmen. Es sei Z, der reelle 
stationäre Prozeß, den wir am Schluß von 8.10.E betrachtet hatten. Es sei etwa Z, 
die Spannungsschwankung eines elektrischen Stromes, die sich als Summe von 
Sinuskurven mit konstanten Frequenzen, jedoch mit zufälligen Phasen und Ampli- 
tuden darstellen läßt. Dann stellt die spektrale Verteilungsfunktion dieses Prozesses 
die Verteilung der elektrischen Energie dar, die von den Komponenten mit den 
vorgegebenen Frequenzen mitgeführt wird, vorausgesetzt, daß die Gesamt- 
energie gleich 1 gesetzt wird. Nun seien A’ und A’ (A’ < 4’) beliebige Punkte auf 
der A-Achse. Dann gilt 


1 
a %: 


wobei die Summation über alle A, des Intervalls [A’, 4’’) erstreckt wird. Der Zu- 
wachs der spektralen Verteilungsfunktion im Intervall [A’, A’’) ist gleich der mitt- 
leren Energie der Komponenten des Prozesses, deren Schwingungsfrequenzen 
zwischen A’ und A” liegen. Für stationäre Prozesse mit kontinuierlichem Spek- 
trum ist die Interpretation analog, doch sind wir hier nicht in der Lage, diese zu 
formulieren. Wir verweisen den Leser auf die Arbeit von JagLom [1] bzw. auf das 
Buch von GRENANDER und ROSENBLATT [1]. 


H. Neben den stationären Prozessen mit stetiger Zeit betrachtet man auch 
stationäre Prozesse mit diskreter Zeit, d. h. stationäre Folgen von Zufallsvariablen. 
Die Definitionen 8.10.4 und 8.10.5 sind in diesem Fall die gleichen, mit dem einen 
Unterschied, daß t und r nun die ganzen Zahlen im Intervall (— 00, oo) durch- 
laufen. Der Begriff der Stetigkeit eines stationären Prozesses ist jetzt überflüssig, 
denn r kann nur ganzzahlige Werte annehmen. 

Wir bemerken, daß bei nur ganzzahlige Werte durchlaufendem £ für ganz- 
zahliges j die Beziehung exp[i(A + 2jr)t] =exp(iAt) gilt. Demnach können 
wir uns bei stationären Folgen darauf beschränken, nur die A-Werte im Intervall 
[—r, rn] zu betrachten. Auch der Satz 8.10.2 gilt für stationäre Folgen, allerdings 
mit der Modifikation, daß die Integration in der Formel (8.10.2) über das Inter- 
vall [—x,r] erstreckt wird. Der Beweis dafür stammt von HrkrcuLorz |1]. 
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Man £indet ihn auch bei Wo [1]. Desgleichen läßt sich auch der Satz von der 
Spektraldarstellung der Prozesse auf stationäre Folgen übertragen. 


Beispiel 8.10.2. Es sei ({X,} (= 0, -+1, +2, ....) eine stationäre Folge (siehe Definition 

7.5.3) von Zufallsvariablen mit den möglichen Zuständen x; (3 = 1, 2, ...), die eine Markoffsche 

. Kette bilden. Die Folge {X,} ist ein stationärer Prozeß im engeren Sinne mit diskreter Zeit. 
In der Tat, sind £,, tz, ..., %.-1, 1, und r ganze Zahlen, so gilt wegen (7.2.3) 


P(X, =%n X = %as ..., Kyı = Ze X = 2.) 
Zei P(Xu BE u) Piriz (ba — &) "" Pin-ıin (im — ba-ı) 
= P(Xy+: _Yp Kootı User Kaıtı =, Kuatı = Zin)* 


Der Prozeß kann jedoch nicht stationär im weiteren Sinne sein, da wir keinerlei Voraus- - 
setzungen über die Momente der Zufallsvariablen X, getroffen haben. 


Beispiel 8.10.3. Es sei {X,} t=0, +41, +2, ...) eine Folge reeller Zufallsvariabler mit 
den Erwartungswerten 0. Die Zufallsvariablen mögen paarweise nicht korreliert sein und die 
Standardabweichung 1 besitzen. Die Korrelationsfunktion R(r) hat dann die Form 


D 


1 für r=0, 
R(t) = E(X,..X,) = 8.10.17 
(?) (Kı+:8:) RE re, ( ) 
Wir bemerken, daß hier 
T 
cos A 
Rd) = N. 1 
PR 
gilt und der betrachtete Prozeß somit die Spektraldichte 
1 
fü) = — (8.10.18) 
27% - 


hat. 

Der in diesem Beispiel betrachtete stationäre Prozeß hat eine konstante Spektraldichte. 
Ein solcher Prozeß heißt weißes Rauschen. Diese Bezeichnung hängt mit der Interpretation 
der Spektralverteilung in physikalischen Problemen zusammen, von der in 8.10.G die Rede 
war. Sie beruht auf der Tatsache, daß in der Spektralverteilung des weißen Lichtes die Inten- 
sität sämtlicher Frequenzen die gleiche ist. 


Die Frage der Gültigkeit des Gesetzes der großen Zahlen für eine im engeren 
Sinne stationäre Folge von Zufallsvariablen wurde in den Arbeiten von BIRK- 
HOFF [1] und CHINTScHin [3] gelöst. [IBRAGIMmow [1] hat ein weitreichendes Ergeb- 
nis bezüglich des zentralen Grenzwertsatzes für eine solche Folge gewonnen. 

Für im weiteren Sinne stationäre Folgen von Zufallsvariablen läßt sich eine neue 
Art des Gesetzes der großen Zahlen betrachten, in dem die Konvergenz im Sinne 
der Definition 8.10.7 zu verstehen ist. Ein solches Gesetz der großen Zahlen findet 
der Leser z. B. in dem Buch von Doo& [5]. 
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I. Ein Grundproblem in der Theorie der stationären Prozesse und Folgen im 
weiteren Sinne ist das Extrapolationsproblem. Es sei {X} (t=0, +1,42, ...) 
eine im weiteren Sinne stationäre Folge. Das Extrapolationsproblem läßt sich wie 
folgt formulieren: Man bestimme für ein ganzzahliges m eine lineare Funktion 


ak 


oo 
AK, 

j-1 
die die Beziehung 


E ( Km X; 
i=1 


2 
) = min (8.10.19) 


erfüllt, und ermittle den Wert dieses Minimums. Mit anderen Worten, auf Grund 
der Kenntnis der Realisierung von X, in den Zeitpunkten , E—1,1—2,... 
wollen wir den Zustand dieses Prozesses zum Zeitpunkt # + m so abschätzen, daß 
(8.10.19) erfüllt ist. Das ist im wesentlichen das Problem der Bestimmung der un- 
bekannten Koeffizienten a, nach der Methode der kleinsten Quadrate. Allerdings 
führt die unmittelbare Lösung nach der in 3.8 angegebenen Methode auf ein System 
von linearen Gleichungen mit unendlich vielen Unbekannten. Die Lösung eines 
solchen Systems ist aber bereits für eine endliche, jedoch große Anzahl von Un- 
bekannten sehr mühsam. KoLMoGoRorrF [12] und WIENER [3] haben ein anderes 
Lösungsverfahren angegeben, das auf der Beziehung zwischen der spektralen Ver- 
teilungsfunktion des stationären stochastischen Prozesses und der zugehörigen 
Korrelationsfunktion besteht. 

Das Extrapolationsproblem für einen im weiteren Sinne stationären Prozeß 
mit kontinuierlicher Zeit läßt sich analog formulieren. Außerdem sind einige 
Arbeiten erschienen, in denen die hier behandelte Theorie der stationären stochasti- 
schen Prozesse auf mehrdimensionale stationäre Prozesse ausgedehnt wird. Eine 
systematische Darlegung der Begriffe und Ergebnisse auf diesem Gebiet findet 
man in den Arbeiten von Masıanı [1], Rosanow [1], WIENER und Masant [1]. 
Siehe auch RosEenBLarr [2]. 


8.11. Martingale 


Wir wollen nun kurz die Theorie eines anderen Typs stochastischer Prozesse 
streifen, die man als Martingale bezeichnet. Dieser Begriff wurde von L&vy [3] 
benutzt, jedoch verdanken wir das erste systematische Studium der Theorie 
und der Anwendungen der Martingale Doog [5], [7], [8], [9] [11] (siehe auch 
Crow [1], Snerr [1] und BiLLıvssLey [3)). 


Definition 8.11.1. Eine Folge {X,} (nr =1,2,...) von Zufallsvariablen nennt 
man ein Martingal, wenn für alle n = 1 die folgenden Bedingungen erfüllt sind: 
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1. Es existiert der Erwartungswert Z(X,) (und es ist somit E(|X,|) < oo). 
II. Die Beziehung (vgl. 3.6.C) 


Xpaltı 0) = X, (8.11.1) 


gilt mit der Wahrscheinlichkeit 1. 


Beispiel 8.11.1. Es sei {Y} eine Folge unabhängiger Zufallsvariabler mit der Eigenschaft, 
daß E(IYT,)<o(d=12,...) und E(Y,)=0 für j>1 gilt. Wir setzen 


Rn 
=3Y, (n=12...). 
je 
Die Folge {X} ist ein Martingal. In der Tat, wegen der Unabhängigkeit der Zufallsvariablen 
Ya, und (X, X, ..., X,) erhalten wir 


EiXar|& ++, &0) = EX + Var) 1% --- > u] (8.11.2) 
= E(Xulan 0) + Eon) = X 


Beispiel 8.11.2. Es möge x, (konstanter Wert) den Einsatz eines Spielers bedeuten, der 
sich an einem Glücksspiel beteiligt, und zwar zu Beginn der ersten Spielrunde. Ferner sei 
Xu (Rn = 1,2, ...) eine Zufallsvariable, die den Einsatz des Spielers nach der »-ten Spielrunde 
bezeichnet. Man pflegt zu sagen, daß es sich um ein gerechtes Spiel handelt, wenn der Er- 
wartungswert für den Einsatz des Spielers nach jeder Spielrunde gleich dem Einsatz zu 
Beginn dieses Spieles ist. Mit anderen Worten (unter der ‚Vorausseizung, daß E(X,|) <oo 
ist), ist das Spiel gerecht, wenn 


EXnnltv es) n=1,2,...) 


mit der Wahrscheinlichkeit 1 gilt. Man kann somit ein gerechtes Spiel als ein Martingal 
definieren. 


Die Definition des Martingals für einen stochastischen Prozeß mit kontinuier- 
licher Zeit lautet wie folgt: 


Definition 8.11.2. Einen stochastischen Prozeß {X,,t€ I} nennen wir ein 
Martingal, wenn E(|X,|)<oo für alle tEI gilt und wenn für beliebige 
h <<. <t (el j=1,2,...,n) die Beziehung 

EX, 8%.) = X 


in 


mit der Wahrscheinlichkeit 1 erfüllt ist. 


Beispiel 8.11.3. Es sei {X,0=<t<.oo} ein stochastischer Prozeß mit unabhängigen 
Zuwächsen, für den P(X, = 0) =1 ist. Gilt für jedes > 0 sowohl E(]X,|) < oo als auch 
E(X,) = const, so ist der Prozeß {X,0 =<t<oo} für t>0 ein Martingal. In der Tat, 
wir haben 


Knaur, - K)te tr An An) F Amy — Kinds 
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wobei die X,,, X, — Xyys +. Ing — X, unabhängig sind. Somit gilt 
EX 5 2) = FIX, + Kay Ill + Con) 
= EX, as) EX — In) 
Fe X, 
mit der Wahrscheinlichkeit 1. 


8.12. Schlußbemerkungen 


Dieses Kapitel war trotz seines großen Umfangs nur eine Einführung in die Theo- 
rie der stochastischen Prozesse. Ein Leser, der sich einen allgemeinen Überblick 
über die stochastischen Prozesse und ihre Anwendungsmöglichkeiten verschaffen 
will, wird mit Interesse die Fellersche Arbeit [6] lesen. Einem Leser, der sich gründ- 
lich mit der gesamten Theorie der stochastischen Prozesse und dem modernen 
mathematischen Rüstzeug dieser Theorie vertraut machen will, empfehlen wir die 
schöne Monographie von Doog [5]. Zusätzlich zu den zahlreichen Arbeiten über 
Markoffsche Prozesse, die wir früher erwähnt hatten, empfehlen wir insbesondere 
zwei Arbeiten von Hunt [1],[2]undeine Arbeit von BLuMevTHaL[1]. Einemoderne 
Behandlung der Grundlagen und der ausgebauten Theorie der Markoffschen 
Prozesse findet man in den kürzlich erschienenen Monographien von Dynkıs [3] 
und Caung [5]. Verallgemieinerungen von Markoffschen Prozessen, und zwar 
semi-Markoffsche Prozesse und Erneuerungsprozesse wurden von Lävy [10], 
SımıtH [1] und Pyke [2], [3] behandelt. 

In dem Buch von CHinwtscHix [2] und in den Arbeiten von Erpös und Kac 
[1], [2], LeCam [2], Dossker [1], [2], PRochorow [2], [3], SkoRocHoD [1], BARTo- 
szyNskı [1], [2] und Birrinestey [1] sowie im zweiten Teil dieses Buches (vgl. 
10.11.C) findet der Leser die Behandlung der Zusammenhänge zwischen den 
Grenzverteilungen für Summen von Zufallsvariablen und den Verteilungen, die 
in der Theorie der stochastischen Prozesse auftreten. 

Wir erwähnen hier noch kurz einige Untersuchungen der Eigenschaften von 
Funktionen, welche Realisierungen eines stochastischen Prozesses darstellen, 
nämlich ihre Stetigkeit, eventuell der Charakter ihrer Unstetigkeitsstellen, ihre 
Integrierbarkeit usw. 

WIENER [1] zeigte, daß der einzige Prozeß {X,0 = t<< oo} mit unabhängigen 
und homogenen Zuwächsen, für den die Formeln (8.9.26) gelten und dessen 
Realisierungen mit der Wahrscheinlichkeit 1 stetige Funktionen sind, der Brown- 
sche Bewegungsprozeß ist. Weitere Untersuchungen über Realisierungen eines 
Wienerschen Prozesses verdanken wir L&vv. Er stellte fest [8], daß diese Reali- 
sierungen irregulärer Natur sind, insbesondere, daß fast alle eine unbeschränkte 
Schwankung aufweisen. Eine weitere einschneidende Irregularität der Reali- 
sierungen eines Wienerschen Prozesses, und zwar die Tatsache, daß sie fast alle 


382 8. Stochastische Prozesse 


an keiner Stelle zunehmen, haben kürzlich Dvorertzky, Erpös und KAkUTanı [1] 
nachgewiesen. Die Verteilungen von Funktionalen, die auf Realisierungen des 
Brownschen Bewegungsprozesses und verwandter Problemstellungen definiert 
sind, wurden von Kac [2], [4], Dooz [4], Lüvy [4], [6], Forrer [1] und anderen be- 
trachtet. Lüvy [2] hat gezeigt, daß für jeden Prozeß X, mit homogenen und un- 
abhängigen Zuwächsen eine Funktion f(t) derart existiert, daß fast alle Reali- 
sierungen des Prozesses X, — f{f) beschränkt sind und rechtsseitige sowie links- 
seitige Grenzwerte an jeder Stelle besitzen. Wir verweisen auf die besonders frucht- 
baren Untersuchungen von DozsBuı [1], [3], Doos [2], [3], [5] und L&vy [5], [7], 
die die Eigenschaften der Realisierungen Markoffscher Prozesse behandeln (siehe 
auch CHung [4]). 

Es sei erwähnt, daß Bedingungen: dafür, daß fast sämtliche Realisierungen 
eines Markoffschen Prozesses stückweise konstante Funktionen sind, von DoEBLIN 
[3] angegeben wurde; Bedingungen, unter denen sie stetig sind oder sowohl 
rechts- als auch linksseitige Ableitungen an jeder Stelle besitzen, gehen auf 
Dynkın [1] und Kınney [1] zurück (siehe auch SKoRocHoD [2]). URBANIK [1] 
untersuchte die Grenzwerteigenschaften der Realisierungen eines Markoffschen 
Prozesses für i— oo. Bedingungen, unter denen fast alle Realisierungen eines 
Markoffschen Prozesses mit endlich vielen-Zuständen einen endlichen Erwartungs- 
wert für die Anzahl von Unstetigkeitsstellen haben, wurden von DOBRUSCHIN 
angegeben [2]. In der Monographie von Doos [5] (Kap. XI, $ 9) findet man eine 
Bedingung, unter der fast alle Realisierungen eines im weiteren Sinne stationären 
Prozesses absolut stetig sind. BELJAJEwW [1] zeigte, daß fast alle Realisierungen 
eines Gaußschen stationären Prozesses mit einer stetigen Spektralfunktion im 
Intervall (— 00, 00) unbeschränkt sind. Weitere Ergebnisse über die Realisierun- 
gen Gaußscher Prozesse findet man bei BELJAJEw [3], DoskuscHaın [6] und 
CIESIELSKI [1]. BELSAJEW [2] hat auch Bedingungen angegeben, unter denen fast 
alle Realisierungen eines im weiteren Sinne stationären Prozesses ganze Funk- 
tionen sind. 

Wir erwähnen ferner eine Arbeit von McKasıx [1] sowie zwei Arbeiten von 
BLUMENTHAL und Geroog [1], [2], indenen Eigenschaften von Realisierungen einer 
gewissen Klasse stochastischer Prozesse mit unabhängigen Zuwächsen ab- 
gehandelt werden. Die Eigenschaften der Realisierungen von Martingalen wurden 
eingehend von Doos [5], [7], [9] untersucht. 

Für beliebige stochastische Prozesse, ohne die Voraussetzung, daß es sich um 
Markoffsche oder stationäre Prozesse handelt, notieren wir die folgenden Er- 
gebnisse: KOLMOGOROFF (siehe SLuTskI [2]) hat Bedingungen angegeben, unter 
denen fast alle Realisierungen eines stochastischen Prozesses stetig sind ; TSCHEN- 
zow [1] (siehe auch Dyxkın [1]) fand eine Bedingung, unter der fast alle Reali- 
sierungen linksseitige und rechtsseitige Grenzwerte besitzen; DoBRUSCHIN [5] 
. und Fısz [7] gaben Bedingungen an, unter denen fast alle Realisierungen ent- 
weder stetig sind oder Unstetigkeitspunkte mit wenigstens einem einseitigen 
Grenzwert haben. Fısz [7] gab Bedingungen an, unter denen fast alle Reali: 
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sierungen stückweise konstante Funktionen mit einem endlichen Erwartungs- 
wert für die Anzahl der Unstetigkeitspunkte sind, wobei er gleichzeitig die Formel 
zur Berechnung des Erwartungswertes für die Anzahl der Unstetigkeitspunkte 
fand; schließlich haben Lo&ve (siehe Livy [4], mit einem von Lo&vz verfaßten 
Anhang) und BELJAJEw [2] Bedingungen angegeben, unter denen fast alle 
Realisierungen stochastischer Prozesse, deren Zufallsvariable endliche Momente 
zweiter Ordnung haben, in der Umgebung eines gewissen Punktes analytisch sind. 
(Siehe die Aufgaben 8.13.21 bis 8.13.31.) 

In den obigen Bemerkungen haben wir die gleichwertigen Redewendungen 
„fast alle‘ und ‚mit der Wahrscheinlichkeit 1“ gebraucht, ohne zu präzisieren,. 
was darunter zu verstehen ist, da dies die Besprechung der Konstruktion von 
Wahrscheinlichkeitsmaßen in reellen Funktionenräumen erfordert. Eine er- 
schöpfende Behandlung dieser Fragen findet der Leser in den Arbeiten von 
KoLmoGorRorrF [7] und Doog [1], [5]. Darüber hinaus sollte hinzugefügt werden, 
daß wir in den gegebenen Informationen die Voraussetzung weggelassen hatten, 
daß die betrachteten Prozesse separabel sind. Die präzise Definition dieses Be- 
griffes findet man etwa bei Doog [5] (Kap. II, $ 2); grob gesprochen bedeutet die 
Separabilität des Prozesses X,, daß eine abzählbare Menge von Punkten {f;} 
@=1,2,...) derart existiert, daß das Supremum oder Infimum fast aller Reali- 
sierungen von X, in einem beliebigen offenen Intervall I gleich dem Supremum oder 
Infimum dieser Realisierung über der Teilmenge der Punkte t, ist, die zum Inter- 
vall / gehören. 
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1. Man zeige, daß der Satz 8.3.1 gültig bleibt, wenn man die Voraussetzung III durch die 


Beziehungen 
We) S 
im ———=1 und W,()=1 fürjedess t>0 
t>0 1- We) & ; 
ersetzt. 


2. Man beweise, daß die Behauptung des Satzes 8.3.1 gültig bleibt, wenn man die Voraus- 
setzung III durch die Voraussetzung ersetzt, daß die Anzahl der Signale in einem be- 
liebigen endlichen Intervall [0,t] endlich ist und daß in jedem Punkt höchstens ein 
Signal auftreten kann. 


3. Es sei (X,0=t<<oo} ein Poissonscher Prozeß mit der Wahrscheinlichkeitsfunktion 

(8.3.4), und es bezeichne r, den (zufälligen) Punkt, in dem das k-te Signal aufgetreten ist. . 

a) Man beweise, daß für j=2,3,... sowie für beliebige t,, ta, ..., it; und T, für die 
sy <t<-.-.<tST gilt, die Beziehung 


&ı ba 2] 


2, 
Pur <b,.,%;<blXr=j)= nl fer 
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erfüllt ist (man vergleiche hierzu die Formel (10.7.1) mit j,=% und fie) = 2 für 
0<2<n. a 

b) Man beweise, daß die Differenzen U, = tr. — 1... (k=1,2,...) unabhängig sind und 
dieselbe durch - 


Gl) = P(U,<?) 0 für TS0, 
= = 
Dr i-exp(—A) für r>0 


gegebene Exponentialverteilung haben. 


Anmerkung. Jeden Signalprozeß (X, 0 =S:t<oo} mitder Eigenschaft, daß die Differen- 
zen U, unabhängig sind und eine gemeinsame Verteilungsfunktion G(r) haben, nennen 
wir einen rekurrenten Prozeß. Demnach ist der Poissonsche Prozeß ein Spezialfall eines 
rekurrenten Prozesses (siehe TaxAcs [4], [6]). 


4. Es sei (X, 0 <:t<.oo} ein Signalprozeß, der die Voraussetzungen I und II des Satzes 
8.3.1 erfüllt, und es seien seine Realisierungen rechtsseitig stetige Funktionen von ti. 
Man zeige, daß die Beziehung (8.3.4) dann und nur dann gilt, wenn fast alle Realisierungen 
dieses Prozesses nur Sprünge der Sprunghöhe 1 aufweisen (FLOREX, MARCZEWSKI und 
RyrLL-NARDZewsKk1 [1]). 


5. Es sei {X,0<St<oo} ein Signalprozeß, der die Voraussetzungen I und II des Satzes 
8.3.1 erfüllt, undessi PX, =0)=1. 
a) Man beweise: Gilt für ein gewisses ganzzahliges !> 1 die Beziehung 
k Wi) 
im = 
u) 


4 (>60) 


und darüber hinaus 


1—- Wi) —- Witt 
m 1%) LEO En 
0 5 


wobei die W,(t) durch (8.3.1) gegeben sind, so gilt für jedes0 < t < ooundi = 0,1, 2,... 


(Ad! 


z! 


P(X, = il) = exp (—Ajl) 


b) Man beweise: Gelten die Beziehungen 
wo 


lim = 4, lim 
t>0 {>08 


hi 1- Mi) - Mt) = Wal) 
im nn = 


0, 
i>0 t 


wobei 4,>0 und 4,>0 ist, so gilt für jedes O<t<o und i=0,1,2,... 


Aub)fı(Agh)r 
I EEE u 


1ı+273=i rtrz! 
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6. 


10. 


25 


Es sei {X,0 <t<oo} ein Signalprozeß, der die Voraussetzungen I und II von 8.3 
erfüllt, undessei P(X,=0)=1. Ferner sei für jedes t> 0 


PAR =1, 
0 


wobei die W;(t) durch (8.3.1) gegeben sind. Man zeige, daß für jedes 0<St<oo und 
i= 0,1,2, ... die Formeln 


x (A ri. (A an 
Wi) = exp (5%) > N 
k=1 nt2r te t+in=i 0 Tim fl: 
1120,., 1720 


gelten, wobei 


(7 
lim Dan k=1,2,...), 
{0 2 
Wl) 2 
in "= In<o 
i>0 k=1 


ist (JAnossy, Rewvı und Acz£r [1]). Man beachte, daß in dieser Aufgabe a Existenz 
der Intensitäten 4, nicht vorausgesetzt wird. 


. a) Man beweise, daß sich der in Aufgabe 6 betrachtete Prozeß {X,, 0 St < oo} in der 


Form 


oo 
= IkYır 
b=1' 


darstellen läßt, wobei {Y,,0<t<oo} (k=1,2,...) ein Poissonscher Prozeß mit 
der Intensität A, ist; dabei sind für jedes 0 St<oo die Zufallsvariablen Yy, Ya --- 
unabhängig. 


b) Man zeige, daß die charakteristische Funktion 9, (u) der Zufallsvariablen X, die folgen- 
de Form hat: 


9,(u) = exp 5» Di Ay (elek —1 |- -3 exp [A,t(eiv: — 1)]. 


. Essei {X ,„0St< oo} der Signalprozeß von Aufgabe 5, und es möge die „Lebensdauer“ 


des Signals eine Exponentialverteilung haben. Ferner sei (Y,0<t<o0} die Anzahl der 
Signale, die zum Zeitpunkt t wirksam sind, und es sei c,(f)= P(Y, =). Man bestimme 
c;(t), E(Y,) und D2(Y,) unter der Voraussetzung, daß c,(0) = 1 ist. 


. Man beweise, daß die Erlangschen Formeln (8.5.17) gültig bleiben, wenn man die Voraus- 


setzung, daß die Lebensdauer 7’ der Signale eine Exponentialverteilung hat, durch die 
Annahme ersetzt, daß 7 eine beliebige Verteilung mit endlichem Erwartungswert besitzt 
(FORTET [2], SEwAsTJanow [2]). 


Essei {X,0<St<{oo} ein Poissonscher Prozeß mit der Intensität A > 0.7, sei die Zeit, 
die man auf das Auftreten des r-ten Signals (r =1,2,...) warten muß. Man zeige, daß 
T, die durch die Formel (5.8.6) gegebene Gammaverteilung hat, wobei x durch £, b durch 
A und p durch r ersetzt wird. 


Fisz 
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11. Es seien {g;\ und {q;;} beliebige Folgen nichtnegativer Konstanten, und es sei 


= N =1,2,...). (*) 
jFi 

Man zeige, daß die q; und die g;; Intensitäten eines gewissen homogenen Markoffschen 

Prozesses sind (Doog [3)]). 


12. Wir betrachten einen homogenen Markoffschen Prozeß mit endlich vielen Zuständen mit 
der Übergangswahrscheinlichkeitsfunktion ?;;(£) und. endlichen Intensitäten g; und q;,, 
die der Gleichung (*) der vorhergehenden Aufgabe genügen. Wir bezeichnen mit „2;;(f) 
die Übergangswahrscheinlichkeit für den Übergang vom Zustand i nach dem Zustand 5 
im Laufe der Zeit i, wenn in diesem Zeitpunkt n Zustandswechsel aufgetreten sind. Man 
zeige (Doosg [2]), daß die folgenden Formeln gelten: 


exp (—gt) für j=i, 
0P;(t) = PER 
0 für j=#1, 


t 
aß) =D fesp [94,6 — S)] YirnPrj(s) ds. 


k#i0 


13. Man zeige: Ersetzt man die Beziehung (8.9.4) durch die Beziehung 


1 
lim — ie: +At,u)du=0, 
so At 

lulze 
so bleibt die Behauptung des Satzes 8.9.1 gültig. 


14. Es sei {X,t e I}, wobei I ein endliches Intervall bedeutet, ein Prozeß mit unabhängigen 
und homogenen Zuwächsen, undessei P(X,=0) = 1. Man zeige, daß dann für jedes 
te I die Zufallsvariable X, eine unbeschränkt teilbare Verteilung besitzt (siehe Aufgabe 
5.14.25). 


15. Es sei {U} quadratisch im Mittel konvergent gegen die Zufallsvariable U. Man zeige, 
daß dann {U} stochastisch gegen U konvergiert. 


In den nachfolgenden Aufgaben 16 und 17 ist in den Beziehungen (*) stets die Konvergenz 
im quadratischen Mittel gemeint. j 


16. Essei {X,t2=0, +1,42, ....} eineim weiteren Sinne stationäre Folge, und es sei m = 0 
und o=1; R(r) sei die Korrelationsfunktion des Prozesses X,. Man zeige, daß die Be- 


ziehung 
N ’ ur i 
lim X=0 (*} 
x1-oN +15 


dann und nur dann erfüllt ist (SLutskı [2]), wenn 


1 N 
lim — Red)=0 
N—0o0 N + 1 er 


gilt. 
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17. 


18. 


19. 


20. 


21. 


Es sei {X, —o0o<6<oo} ein im weiteren Sinne stationärer Prozeß mit m— (0 und 
o=1. Wir setzen 


T re 
X dt= lim NV N Xırım- (*) 
N k=1 . 


—& 
v 


Man zeige, daß die Beziehung 


T 
iı H R7 
lim 7 [ma =0 (*) 
Too T 
0 


dann und nur dann gilt, wenn 


T 
1 
lim zjroa=0 
T - 
To 
0 
erfüllt ist. 


Es sei (X,t=0, +1,42, ...} eine im weiteren Sinne stationäre Folge mit der Korre- 
lationsfunktion R(r) = al! (r= 0, +1, +2,...), wobei a reell und |al<1 ist. Man 
bestimme die Spektraldichte dieses Prozesses. 

Die Spektraldichte der im weiteren Sinne stationären Folge {X,t=0, +1,42, ....} 
habe die Form 


_ ce (&—b)(er#—b) 
2 (eR —a)(e% —a)’ 


f@) 


wobei a und 5 reell sowie [a|< 1 und |b| < 1 sind. Man zeige, daß die Korrelations- 
funktion R(r) die folgende Form hat: 


1—2ab+ 
a ie, 
1-—.a? 
Ri) = 
(a —b) (1 — ab) R 
ea 1 für T= +1, +2... 
1—a? \ 


Es sei {X, — 00 <t<£oo} ein im weiteren Sinne stationärer Prozeß. 
a) Man bestimme die Spektraldichte des Prozesses, wenn 


Rt) = e-eki 


mit «>60 gilt. 


b) Man bestimme die Spektraldichte des Prozesses für 
R(r) = e”ekl cos br (a>0). 


Es sei {X,0<t<oo} ein separabler Markoffscher Prozeß, und es sei die Beziehung 


im PX ya - #0 =2)=0 
4-0 " 
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gleichmäßig bezüglich (0 =! <oo) und bezüglich 2 (—oo <x<oo) erfüllt. Man 
zeige, daß dann fast alle Realisierungen dieses Prozesses stückweise konstant mit 
endlich vielen Unstetigkeitspunkten in jedem endlichen Intervall sind (DozsLin [3]). 


22. Essei {X,,t € I} ein separabler Markofischer Prozeß, wobei I ein abgeschlossenes endliches 
Intervall ist. Wir setzen 


Ch,)= up PiX4n-LAl>eX=e). 
1t+AteI 
-Xo<e<o 


a) Man beweise: Gilt für jedes &> 0 die Beziehung 
,_ Che) 
lim = 


0, 
a 


so sind fast alle Realisierungen des Prozesses stetig in I. (Dynkın [1], Kınnay [1]. 
Diese Behauptung gilt auch unter schwächeren Voraussetzungen. Siehe Fısz [7].) 


b) Man zeige: Gilt für jedes e> 0 die Beziehung 
lim C(h,) = 0, 


h>0 


so haben fast alle Realisierungen des Prozesses beide einseitigen Grenzwerte an jeder 
Stelle t & I (Kınnzx [1]). 


23. a) Es sei (X,0 <i<s1} ein stochastischer separabler Prozeß. Man beweise: Gilt die 
Beziehung 


E(lXır. — LP) < OlAtilte, (*) 
wobei ß> 0,&> 0 und O Konstanten sind, für beliebige Punktet und t + At aus 


dem Intervall (0, 1}, so ist für jedes y < n die Beziehung 


Run 
P (Im 0, osısı)-1 (**) 
a0  Idir 


gleichmäßig bezüglich £ erfüllt. (Die Stetigkeit fast aller Realisierungen des Prozesses 
X, unter der Voraussetzung (*) hat KoLmoGoROFF nachgewiesen. Den Beweis dafür 
findet man z. B. in der Arbeit von Suurski [2]. Ein Satz mit einer der Behauptung 
(**) äquivalenten Aussage stammt von Lo&vr [4], 3. Auflage.) 


b) Aus der Beziehung (**) leite man her, daß für <« 
P(X, = cont, 0 stis1)=1 
gilt. 
c) Man beweise, daß für den Wienerschen Prozeß die Beziehung (**) für jedes Yy< > gilt. 


24. Es sei {X,0St=<1} ein separabler stochastischer Prozeß. Wir wollen annehmen, daß 
für beliebige Punkte 1,12 8; (fi <t, <,) aus dem Intervall [0, 1] die Beziehung 


ER, —- Ku Pl X, —- Zu, 1< Cl ltr 
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25. 


26. 


27. 


28. 


29. 


gilt, wobei p> 0,g >0 und r> 0 und © von £ unabhängig ist. Man zeige, daß dann 
fast alle Realisierungen des Prozesses beide einseitige Ableitungen an jeder Stelle & € [0, 1] 
besitzen (Tscnenzow [1}). 


Es sei {X,, t e I,} ein separabler stochastischer Prozeß, wobei I, ein endliches abgeschlos- 
senes Intervall bezeichnet. X, möge den Zuwachs des Prozesses X, im Intervall II, 
bezeichnen. Ferner sei a(J) = P(X7 #0), b(I,e) = P(|X,|'> e), während 17 | die Länge 
des Intervalls 7 bedeuten möge. Wir nehmen an, daß die Beziehung 


lim b(I,e) = 0 (*) 
I2]>0 


für jedes €e>0 gilt und daß darüber hinaus 


Im. Sally) <oo (**) 


n>X k=1 


ist, wenn max |/„,.| > 0 geht; hierbei bedeutet {/,„,} eine Unterteilung des Intervalls 
1<k<n 

I, in disjunkte Teilintervalle Ink (k=1,2,...,n). Man zeige, daß dann fast alle Reali-. 

sierungen des Prozesses in I, stückweise konstant sind und daß die Anzahl der Unstetig- 

keitspunkte einen endlichen Erwartungswert besitzt, der dem Grenzwert auf der linken 

Seite von (**) gleich ist. Darüber hinaus sind in jedem einzelnen Punkt t e I, die Reali- 

sierungen mit der Wahrscheinlichkeit 1 stetig (Fısz [3], [7)). 


Es sei {X,,t € I,} ein separabler stochastischer Prozeß. Man zeige, daß fast alle Reali- 
sierungen des Prozesses keine Unstetigkeiten erster Art!) besitzen, wenn für jedes e> 0 
die Beziehung 


lim „Dd(Iz. e) = 0 (*) 
n>X k=1 
erfüllt ist, sobald max [/„.]— 0 geht; hierbei hat {I,„,} die gleiche Bedeutung wie in 
1<k<n 
Aufgabe 25 (Fiısz [7]). 
Es sei {X,teIJ,} ein separabler homogener Markoffscher Prozeß oder ein separables 
Martingal. Man zeige, daß bei Gültigkeit der Beziehung (*) von Aufgabe 26 fast alle 
Realisierungen des Prozesses stetig sind (wegen des Markoffschen Prozesses. vergleiche 
Fuchs [1], wegen der Martingale Fısz [7]). 


Es sei {X,,te I,} ein separabler Prozeß mit unabhängigen Zuwächsen, und es sei 
lima(I)=0. 
Izj>0 
Man zeige, daß dann für fast alle Realisierungen des Prozesses sämtliche Behauptungen 
der Aufgabe 25 gelten. 


Man zeige, daß fast alle Realisierungen eines reellen, separablen, stationären Gaußschen 
Prozesses {X,, —oo <t<oo} mit stetiger spektraler Verteilungsfunktion unbeschränkt 
sind (BELJAJEW [1]). 


1) Die Funktion f(t) hat eine Unstetigkeit erster Art an der Stelle i, wenn beide Grenzwerte 
ftt — 0) und f(t + 0) existieren und voneinander verschieden sind. 
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30. Es sei {X,, —oo <t<.oo} ein separabler, reeller, stationärer und stetiger Gaußscher 


31. 


Prozeß. Man zeige (DoBruschin [6]), daß dann entweder fast alle Realisierungen stetig 
sind oder aber $> 0 derart existieren, daß fast alle Realisierungen für jedes t, die Be- 
ziehung 


lim X, — lim X, > ß 
t>to > 
erfüllen. 


Es sei {X,, —oo <t<<oo} ein reeller, separabler und stetiger, im weiteren Sinne statio- 
närer Prozeß mit E(X,)=0 und D®{X,) =0. Man zeige: Genügt die Korrelations- 
funktion R(r) für T->0 der Beziehung!) - 


Rd) = 1 — O(Ir]!*) 


mit 6>0, so sind fast alle Realisierungen des Prozesses stetig. 
Hinweis. Man stütze sich auf die Aufgabe 23. 


1) Mit anderen Worten, es existiert eine Konstante C >0 derart, daß für r—0 die 


“Beziehung R(z) < O|rj1t5 gilt. 


ZWEITER TEIL 


MATHEMATISCHE STATISTIK 


9. STICHPROBENMOMENTE UND IHRE FUNKTIONEN 


91. Der Begriff einer Stichprobe 


Im ersten Teil dieses Buches wurde die Wahrscheinlichkeitsrechnung behandelt. 
Wir bauten die Wahrscheinlichkeitsrechnung als eine mathematische Theorie auf, 
in welcher der abstrakte Wahrscheinlichkeitsbegriff dem Häufigkeitsbegriff zu- 
fälliger Erscheinungen entspricht, die man in der Wirklichkeit beobachten kann. 
Der Wahrscheinlichkeitsbegriff steht in demselben Verhältnis zur Häufigkeit eines 
zufälligen Ereignisses wie etwa der exakte Begriff einer geometrischen Figur in 
der euklidischen Geometrie zur wirklichen Figur im uns umgebenden Raum. Des- 
halb hat die Wahrscheinlichkeitsrechnung eine ähnliche Bedeutung für statistische 
Probleme, bei welchen man durch Beobachtung von Häufigkeiten die Gesetz- 
mäßigkeiten zufälliger Erscheinungen untersucht, wie sie die Geometrie für die 
Geodäsie hat. 

Der zweite Teil dieses Buches will zeigen, wie mit Hilfe der Wahrscheinlichkeits- 
rechnung zahlreiche statistische Probleme gelöst werden können. 

Im Laufe dieser Untersuchungen wird es notwendig sein, unsere Kenntnisse über 
die Wahrscheinlichkeitsrechnung zu vertiefen, vor allem auf den Gebieten, in denen 
sich Wahrscheinlichkeitsrechnung und mathematische Statistik eng berühren. 

Die statistischen Fragen, mit denen wir uns befassen wollen, bestehen meistens 
darin, daß auf Grund der Kenntnisse der Eigenschaften einer entsprechend ge- 
wählten Teilmenge von Elementen, die einer gewissen Gesamtmenge entnommen 
wurden, Schlüsse zu ziehen sind, welche die zu untersuchenden Eigenschaften der 
übrigen unbekannten Elemente betreffen. 

In der Statistik nennt man die Gesamtmenge, deren Elemente wir jeweils unter- 
suchen, die Grundgesamtheit oder einfach die Gesamtheit. 

Die Elemente der Gesamtheit kann man hinsichtlich verschiedener Merkmale 
untersuchen. Wenn wir sagen, daß die Grundgesamtheit die Verteilung F{x) hat, 
so wollen wir dadurch ausdrücken, daß wir das Merkmal X der Elemente dieser . 
Grundgesamtheit untersuchen und dieses Merkmal in der Gesamtheit eine Ver- 
teilung hat, die durch die Verteilungsfunktion F (x) charakterisiert wird. 

In der Statistik nennt man eine endliche Teilmenge, die aus Elementen der 
‚Grundgesamtheit besteht, Stichprobe. Wir wollen unter einer Stichprobe eine Folge 
von Merkmalswerten einer gewissen Anzahl von Elementen, die zur Gesamtheit 
gehören, verstehen. Die Elementeanzahl der Stichprobe wollen wir ihren Umfang 
nennen. Wir fragen nun nach der mathematischen Bedeutung einer zufälligen 
Stichprobe. 
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Es sei das Merkmal X der Elemente einer Grundgesamtheit eine Zufallsvariable 
mit der Verteilungsfunktion F,(x). Wir betrachten eine Gesamtheit, deren Ele- 
mente j-elementige Systeme j/ =2,3,...) sind, die aus allen möglichen Elemen- 
ten der Grundgesamtheit gebildet werden. Die Elemente dieser m-dimensionalen 
Gesamtheit charakterisiert der Zufallsvektor (X, X,,...,X;), wobei X, (k=1, 
2,...,5) der Wert des Merkmals X des k-ten Elements des Systems ist. Wir wollen 
annehmen, daß für k=1,2,... sowie für beliebige &,, 23 ...,% die bedingte 
Wahrscheinlichkeit 


Fran...) = PXan<elX =2..,X =) 


existiert. Nach einer gewissen Methode, wir wollen sie mit .M bezeichnen, wählen 
wir aus der Grundgesamtheit Systeme von je » Elementen als Stichproben aus und ° 
beobachten die Werte z,, % ..., % des Merkmals X der ausgewählten Elemente. 

Es sei jetzt (X,, X, ...:, X„) der beobachtete Zufallsvektor, d.h, X, (k=1, 
2,...,n) ist eine Zufallsvariable, deren mögliche Wertmenge aus den Beobach- 
tungen an x,, dem k-ten Stichprobenelement, in jeder möglichen n-elementigen 
Stichprobe besteht, die nach unserer Methode M aus der Grundgesamtheit aus- 
gewählt wurde. 


Definition 9.1.1. Die Auswahlmethode M von Elementen in die Stichprobe ist 
zufällig, wenn 
1. für jedes x die Gleichung 


i P(X,<x)= F,) (9.1.1) 

gilt; 
2. für jedes k=1,2,...,n — 1 und für beliebige &,, &,, ..., %; die Gleichung 
P(Xın <elX, =%,., Ar =%) = Frl2]|&, ...,%%) (9.1.2) 


erfüllt ist. 
Eine Stichprobe (x}, &3, ..., %,), die wir nach einer zufälligen Auswahlmethode 
erhalten haben, nennen wir eine zufällige Stichprobe. 

Dies läßt sich geometrisch deuten: Alle möglichen Werte der n-dimensionalen 
Zufallsvariablen (X, X, ..., X,) stellen eine Punktmenge im n-dimensionalen 
Raum dar. Eine zufällige Stichprobe vom Umfang r ist ein Punkt dieser Punkt- 

menge. Die Menge aller zufälligen Stichproben vom Umfang » nennen wir den 
‚Stichprobenraum. 
Methoden der ee werden in Kapitel 14 behandelt. 


Definition 9.1.2. Eine zufällige Stichprobe nennen wir einfach, wenn die 
Zufallsvariablen X,, X,, ..., X, voneinander unabhängig sind. 

Sind andere Voraussetzungen nicht besonders hervorgehoben, so verstehen wir 
unter einer Stichprobe immer eine zufällige Stichprobe. 


Beispiel 9.1.1. Für jede durch eine staatliche Landwirtschaftszählung erfaßte Bauern- 
wirtschaft wurde eine Karteikarte angefertigt. Auf diesen Karten war unter den untersuchten 
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Merkmalen auch die Größe des zu einer Bauernwirtschaft gehörenden Ackerlandes in Hektar 
angegeben. Alle Bauernwirtschaften hatte man hinsichtlich dieses Merkmals in 7 Gruppen 
eingeteilt, die durch die Zahlen 1 bis 7 gekennzeichnet wurden. Auf jeder Karteikarte ist 
also eine der Zahlen 1 bis 7 eingetragen, die wir mit X bezeichnen wollen. Welchen Wert 
X annimmt, hängt davon ab, zu welcher Gruppe der untersuchte landwirtschaftliche Betrieb 
gehört. Die Größe X sei das zu untersuchende Merkmal. 

Die Grundgesamtheit wird hier durch alle Karteikarten dargestellt; ihre Anzahl sei N. 
Aus dieser Kartenmenge greifen wir aufs Geratewohl r» = 10 Karten heraus; dabei legen wir 
aber vor Wahl jeder nächsten Karte die vorher herausgegriffene Karte in die Gesamtmenge 
der Karten zurück. Die Wahrscheinlichkeit dafür, daß das Merkmal X den Werti(i = 1,..., 7) 
annimmt, ändert sich also während des Herausgreifens der einzelnen Karten nicht. Die 
Werte (x, #3, ...,%o) der Zufallsvariablen X, die auf den 10 herausgegriffenen Karteikarten 
beobachtet wurden, stellen einen Wert einer zehndimensionalen Zufallsvariablen dar. Dieser 
beobachtete Wert der zehndimensionälen Zufallsvariablen ist eine Stichprobe vom Umfang 
10. Der Stichprobenraum besteht aus allen möglichen 10-Tupeln (2,23 ...,210). Da x 
(k = 1,2,...,10) eine der Zahlen 1, 2,..., 7 darstellt, besteht hier der Stichprobenraum aus 
710 Punkten. 


9.2. Der Begriff der Stichprobenfunktion 


Definition 9.2.1. Unter einer Stichprobenfunktion verstehen wir eine Zufalls- 
variable, die selbst eine Funktion einer Stichprobe, d.h. einer beobachteten »- 
dimensionalen Zufallsvariablen (X,, X, ..., X,) ist. 

Die Frage nach der Verteilung einer Stichprobenfunktion gehört zu den Grund- 
problemen der mathematischen Statistik. 


Hier interessieren uns zwei derartige Probleme. Das eine lautet: Wir suchen 
für jedes natürliche n die Verteilung der gegebenen Stichprobenfunktionen 
Zu = Z(X,Xy ...,X,); wir wollen sie die exakte Verteilung der Stichproben- 
funktion nennen. Die Kenntnis der exakten Verteilung einer Stichprobenfunktion 
hat große praktische Bedeutung für statistische Untersuchungen, in denen die 
Anzahl der Beobachtungen klein ist. Wir sprechen in diesem Fall von einer kleinen 
Stichprobe. 

Bei der zweiten Fragestellung suchen wir nicht die ‚Verteilungen einer Stich- 
probenfunktion für jedes einzelne » zu bestimmen, sondern interessieren uns nur 
für die Grenzverteilung der Stichprobenfunktion Z, für n—> oo, Die Grenzver- 
teilungen der Stichprobenfunktionen finden dort Anwendung, wo die Anzahl 
der Beobachtungen groß ist. Wir sprechen dann von einer großen Stichprobe. 


Es existiert kein allgemeines Kriterium, das uns zu entscheiden erlaubt, wann 
eine Stichprobe als groß und wann sie als klein anzusehen ist. Diese Entscheidung 
hängt von den einzelnen Stichprobenfunktionen ab. Eine Stichprobe kann für die 
eine Stichprobenfunktion als groß gelten, während sie für eine andere Stichproben- 
funktion noch nicht als genügend groß angesehen werden kann. 
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9.3. Die Verteilung des arithmetischen Mittels normal verteilter Zufallsvariabler 


Die Bestimmung der exakten Verteilungen einer Stichprobenfunktion ist im all- 
gemeinen sehr kompliziert. Doch gibt es verhältnismäßig einfache Methoden, um 
dieses Problem in einigen wichtigen Sonderfällen zu lösen. 

Vor allem wollen wir die Verteilung einiger Stichprobenfunktionen bestimmen, 
falls das betrachtete Merkmal X der Grundgesamtheit normal verteilt ist mit der 
Dichte 


2 ee; (9.3.1) 


1 
DE er er 


hierbei ist m der Mittelwert und o die Standardabweichung von X. Wir betrachten 
die durch 


zeig (9.3.2) 
z 


definierte Stichprobenfunktion und setzen voraus, daß die Zufallsvariablen X, 
unabhängig sind und alle dieselbe durch die Dichte (9.3.1) bestimmte Verteilung 
besitzen. Um nun die Verteilung dieser Stichprobenfunktion zu finden, wenden 
wir die Theorie der charakteristischen Funktionen an. Wie aus (5.7.4) bekannt ist, 
hat die charakteristische Funktion der normalen Zufallsvariablen X die Form 


Po? 
pt) = exp (- Br + im). (9.3.3) 


Die Zufallsvariablen X, sind unabhängig, und daher folgt aus den Gleichungen 
(4.4.3) und (4.2.15), daß die charakteristische Funktion o,(t) der Stichproben- 
funktion X die Form 


20? 
9,(t) = exp (- le im) (9.3.4) 
2n 4 
hat. Dies ist die charakteristische Funktion einer normalen Zufallsvariablen 


N (m v) . Also wird die Dichte der Zufallsvariablen X durch die Formel 
n 


ne, 2 
h&) = : 1 exp (- n Ze (9.3.5) 


ausgedrückt. Wie wir sehen, hat die Zufallsvariable X denselben Mittelwert wie 
X; sie ist aber mehr um diesen Mittelwert konzentriert. 
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Beispiel 9.3.1. Die Zufallsvariablen X, sind unabhängig und haben alle die gleiche Dichte, 
‘die durch folgende Formel bestimmt ist: 


1 1&—1)% 
(&) = exp |— — ——]. (9.3.6) 
2 Yarı 2 4 5 
Wir suchen die Verteilung der Zufallsvariablen 
= 1 ı 
X mn k* 
16 ;=, 


Nach (9.3.5) hat die Zufallsvariable X die Dichte 
= 2 = ai: 
h(&) = — exp (-2(@ — 1°). 
27 


Die Standardabweichung der Zufallsvariablen X beträgt also 0,5. Wir suchen die Wahrschein- 
lichkeit dafür, dß O<X<2 ist. Es gilt 


u x—1 
PosX<n-r(-2s D5 2). 


Den Tafeln für die Normalverteilung entnehmen wir 
POSX<2)» 0,9544. 


Zum Vergleich berechnen wir die Wahrscheinlichkeit dafür, daß die Zufallsvariable X 
in denselben Grenzen enthalten ist. Wir erhalten. 


RER 9 
Posxsn=r(-3= 2 < 5)» 030. 


Wie wir sehen, ist die Zufallsvariable X weniger gestreut als X. 


\ 

Dieses Beispiel kann man praktisch so deuten: Es liegt eine bestimmte Gesamt- 
heit vor, und uns interessiert das Merkmal X der Elemente dieser Gesamtheit. 

Dieses Merkmal habe eine durch (9.3.6) bestimmte Normalverteilung. Aus der 
Gesamtheit greifen wir aufs Geratewohl unabhängige einfache Stichproben zu 16 
"Elementen heraus, beobachten die Werte des Merkmals X in diesen Stichproben 
und berechnen den Wert der Stichprobenfunktion X. Es zeigte sich, daß wir bei 
genügend oft wiederholter Entnahme dieser Stichprobe vom Umfang 16 in un- 
gefähr 95 von 100 Fällen solehe Werte von X erhalten, die nicht negativ und 
nicht größer als 2 sind. Wählten wir dagegen wiederholt ein einziges Element, 
dann erhielten wir nur in ungefähr 38 von 100 Fällen Werte von X, die in denselben‘ 
Grenzen liegen. 

Der Formel (9.3.5) entnehmen wir, daß die Verteilung der Stichprobenfunktion 
X von n abhängt. In Abb. 5.7.1 sind die Verteilungen N (0; 1), N (0; 0,5) und 
N (0; 0,25) graphisch dargestellt. Sie stellen gleichzeitig die durch (9.3.5) be- 
stimmten Dichten von X für an =1,n =4,n = 16 dar, wenn die Veränderlichen 
X, nach der Formel (9.3.1) verteilt sind, inder m =0 und so =1 gesetzt ist. 


| 
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9.4. Die x2-Verteilung 


Wir betrachten » unabhängige Zufallsvariable Xy% mit derselben Verteilung, 
deren Dichte 


fa) = —— exp (- = ı) (9.4.1) 


sei. Die Voraussetzung E(X,) =0 schränkt hier die Allgemeinheit :nicht ein; 
wäre nämlich E(X,) =m = 0, so könnten wir die Zufallsvariablen X, — m 
betrachten, deren Mittelwert ZE(X, — m) gleich Null ist. 

Die Stichprobenfunktion x? definieren wir durch 


n 
=) X. (9.4.2) 
k=1 
Beispiel 9.4.1. Das Merkmal X der Elemente einer gewissen Gesamtheit sei normal 


verteilt mit dem Mittelwert E(X) = 0. Dieser Gesamtheit entnehmen wir eine Stichprobe 
vom Umfang rn und beobachten an deren Elementen die Werte des Merkmals X. Wir be- 


“ n 
zeichnen diese Werte mit x,,%, ...,2„ und berechnen den Wert des Ausdrucks Sa}. Dies 


ist der beobachtete Wert der Stichprobenfunktion 7°. k-1 


Wir suchen zuerst die Verteilung der Zufallsvariablen Y = x®, wenn die 
Verteilung von X durch (9.4.1) bestimmt ist. Auf Grund von (2.4.14) hat die 
Dichte der Zufallsvariablen Y die Form 


ı _ı9% 
un la te 
f) für y<0. 

Die Zufallsvariable Y hat also eine Gammaverteilung nach der Formel (5.8.6), 
inder p = S, b= 3S zu setzen ist. Da für Zufallsvariable mit einer Gamma- 


verteilung der Additionssatz gilt (vgl. 5.8), hat die Zufallsvariable x?, die durch die 


Formel (9.4.2) gegeben ist, ebenfalls eine Gammaverteilung mit 9= 5 und. 


= ER Also ist ihre Dichte durch 
20? . 


1 eu N 1 
20° 2 für u>ß0, 
I Rorr (2) (9.4.4) 
0 für us0O 


gegeben, wobei u die Werte der Zufallsvariablen x? sind. 
. Die Verteilung der Zufallsvariablen wurde von HELMERT [1] berechnet. 
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Aus (5.8.10) erhalten wir für den Mittelwert und die Dispersion der Zufalls- 
variablen x? 


MmMı=No, Ha 2not. (9.4.5) 


Die durch (9.4.4) bestimmte Verteilung nennt man die x?-Verieilung mit n 
Freiheitsgraden, entsprechend der Tatsache, daß x? eine Summe von n unabhängi- 
gen Summanden ist. 

Für zwei beliebige Werte.u, >0 und w>0 mit u, < u, gilt also 


Ur 
Pi <2?<%) = | g(u) du; 
Ur 


dabei ist 9,(w) die durch (9.4.4) bestiminte Funktion. i 
In den Anwendungen der Stichprobenfunktion x?, die wir später besonders 
besprechen werden, benutzt man häufig den Ausdruck 


oo 


1 2 en 
PZ=Ww = ———— | e 42 du, (9.4.6) 


2 ar(2)“ 
2 
indem u, > 0 ist. 


Die Tafeln der x2-Verteilung enthalten die Werte (9.4.6) für verschiedene Zahlen 
u, und r bei festem o — 1. Um diese Tafeln für o + 1 benutzen zu können, hat 
man %, =2,0° zu setzeri. Dann geht P(y? = u,) in P(2? = 2,0) über. Führt man 


nämlich in dem Ausdruck (9.4.4) die Substitution 2 = — aus und beachtet man die 
[3 


Regel für die Transformation einer Dichte, so ergibt sich 


it 
—e ?2? für z2>0, 


N 
T ) (9.4.7) 


0 für 2<0. 


Der Ausdruck (9.4.7) ist schon die Dichte der Stichprobenfunktion 2füro=1. 
In Abb. 9.4.1 sind die Dichten der Zufallsvariablen x? für einen Freiheitsgrad 
und für sechs Freiheitsgrade dargestellt. 


Beispiel 9.4.2. Die Zufallsvariablen X, (k=1,2,...,8) seien unabhängig, und jede 
von ihnen habe die gleiche Normalverteilung N (0; 2). Wir bestimmen die Stichprobenfunktion 


8 
2=dX- 
k=1 
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Die Zufallsvariable x? hat also 8 Freiheitsgrade; ihr Mittelwert und ihre Standardabweichung 
sind nach (9.4.5) j 


m=3, Ya = 16. 
Wir berechnen die Wahrscheinlichkeit dafür, daß x? nicht kleiner als 40 ist. Wegen 0 —= 2 


40 
ist — = 10. Diese Wahrscheinlichkeit ist also gleich P(y? > 10). Aus den Tafeln der y?- 
0? ; 
Verteilung (füro = 1) erhalten wir bei 8 Freiheitsgraden 
Pix? >= 9,524) » 0,30, P(2 2 11,030) »z 0,20. 


Bei linearer Interpolation ergibt sich 


Piz? > 10) x 0,30 SO re 
MT TERT: TEE Y77 


Abb. 9.4.1 


Beispiel 9.4.3. In Beispiel 5.11.1 stellten wir fest, daß die Geschwindigkeitskomponenten 
Y. V,, V, eines Gasmoleküls (in einem idealen Gas) die gemeinsame Dichte 


2 2 y2 
exp (- yrwr ) 


20? 


h(v1, v9, d) = F 
(2x2)? 


besitzen. Die Zufallsvariable 
r=-rv?+v3+P2 


hat eine y2-Verteilung mit drei Freiheitsgraden. Ihre Dichte g(v?) ist nach Formel (9.4.4) 
durch . 


v2 5 
vexp (- =) für v»>0, 


gl) = 4 0° Yan 


0 für vS0O 
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gegeben. Hieraus erhalten wir für die Geschwindigkeitsdichte /(v) die Maxwellsche Formel 


y? v2 ; 
»exp(— —| für v>0, 
20 


io) = 1 Ya (9.4.8) 
0 für »<0. 
Wir bestimmen die Dichte der Stichprobenfunktion 
1. 
Y=- IX, 
N = 


die gleich dem mittleren Quadrat von n unabhängigen Zufallsvariablen X, ist, 
wobei alle X, gleich normal N (0; o) verteilt sind. 


Da Y= E x” gilt, ist die Dichte f(y) der Zufallsvariablen Y durch 
n 


N 


nn 


2 er nn 

z 2 e 2 y2 ! für y>®0, 
Iy)=- 122 oT () (9.4.9) 

0 für ysO 

bestimmt. Wir finden 
4 
EN=e, Dun=T. (9.4.10) 
n 


Die Tafeln für 4? berücksichtigen gewöhnlich nur 30 Freiheitsgrade. Fisher [6] 
hat bewiesen, daß die Zufallsvariable Y2%? asymptotisch normal N (Y?r —1; i) 
verteilt ist, wenn die Anzahl » der Freiheitsgrade unbegrenzt wächst. 

Für n > 30 kann man schon diese Grenzverteilung benutzen. 


B. Nun seien die Zufallsvariablen X, (k =1,2,...,r) unabhängig, und es möge 
jedes X, die Verteilung N (m;; 1) haben. Dann heißt die Stichprobenfunktion 


& n 
R=yX 
k=1 . 
das nichtzentrale y2. Die Dichte k,(w) dieser Stichprobenfunktion hat die Form 


N 


1 
—n-1 
2 


exp - - + | u 


7 Anl? (25/1 3 1 
hut) = | Fr? io (25) rli+gn) (9.4.11) 
für u>0, 
0 für us0, 


26 Fisz 
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’ 
wobei 7? = Nm; ist. Man nennt ı? den Nichtzentralitätsparameter und n die 


k-1 
Anzahl der Freiheitsgrade. 

Den Beweis für die Formel (9.4.11) findet der Leser in der Monographie von 
ANDERSoN [1]. Tafeln der nichtzentralen y?-Verteilung wurden von Fix [1] heraus- 
gegeben. 


9.5. Die gemeinsame Verteilung der Stichprobenfunktionen X und 8 


Beispiel 9.5.1. Einer Grundgesamtheit, in der das Merkmal X normal N(0; 0) verteilt 
ist, entnehmen wir eine einfache Stichprobe, die den Umfang rn hat. Die beobachteten Werte 
der Zufallsvariablen X seien x), 29 ...,%,. Für diese Stichprobenwerte berechnen wir den 
Mittelwert. und die Standardabweichung s nach den Formeln 


1 5 i 3 EL 
—_ un 2=—  - MD =— u — ©. 
n-l Rd u 2, ö 

Entnehmen wir der betrachteten Grundgesamtheit eine Serie von einfachen Stichproben, 
die alle den Umfang n haben, so werden wir im allgemeinen eine Serie von verschiedenen 
WWertepaaren & und s erhalten. Die von uns beobachteten Werte x und s stellen einfach den 
beobachteten Wert der zweidimensionalen Zufallsvariablen (X, 8) dar. Ebenso sind die 
beobachteten Werte & und s, für sich betrachtet, Realisierungen der Zufallsvariablen X bzw. 
S, wobei 


5 Ye zl (9.5.1) 


gesetzt ist. 

In den Anwendungen ergibt sich häufig die folgende Aufgabe: Man hat in der Stichprobe 
die Werte und s beobachtet, wobei es sich zeigte, dB a<z <b.und s>eist. Wir suchen 
die Wahrscheinlichkeit für diese Ungleichungen, d.h., wir wollen feststellen, mit welcher 
angenäherten Häufigkeit die Werte & der Stichprobenfunktion X und die Werte s der Stich- 
probenfunktion $ auftreten, die diese Ungleichungen erfüllen, wenn wir eine lange Serie von 
Stichproben machen. 

Um diese Frage beantworten zu können, müssen wir die gemeinsame Verteilung der 
Stichprobenfunktion (X, 8) finden. 


A. Es seien X, (k =1,2,.:.,») unabhängige Zufallsvariable mit der gleichen 
Verteilung. Die Dichte ihrer Verteilung sei 


1 a2 
N = er 55). 
6 y2 7 20° 
Wie wir schon in 9.4 bemerkten, bedeutet die Annahme Z(X,) =0 keine Ein- 
schränkung der Allgemeinheit. Es sei f(&,,%,, ..., 2„) die Dichte der n-dimensiona- 


len Zufallsvariablen (X,, X, ..., X,). Unter einem Wahrscheinlichkeitselement 
dieser Zufallsvariablen verstehen wir- den Ausdruck 


dP = fu Kay er, %) da, day. day. 


9.5: Die gemeinsame Verteilung der Stichprobenfunktionen X und 8 403 


Da die Zufallsvariablen X, unabhängig sind, erhalten wir 


dP = — Xp Er 38 > dx, dag da, 
or (An)? ‚= 
2 Y} 
= - exp — Aa de, daz---dan. (9.5.2) 
Ei 20° 
o*(2n)? 
Wir führen die Substitution 
. =E+s% (k=1,2,...,n) (9.5.3) 


durch. Aus den Beziehungen 
n R n 
Nuyumnt, Dan + ns 
k=1 k=1 
folgen zwei Gleichungen, die zwischen den Veränderlichen 2; bestehen, nämlich 
n n 
4 =0, Yan. (9.5.4) 
k=1 k=1 


Folglich sind zwei Veränderliche, zum Beispiel 2,_, und 2,, Funktionen der übrigen. 
Aus den Formeln (9.5.4) ergibt sich, daß entweder 


A—B 
<n-1 = P) ’ 
(9.5.5) 
A+B 
= 5 
oder 
A+B 
An = gr 
(9.5.6) 
A-B 
>= 2 
ist, wobei 


n—2 n—2 n—2 
A=— 2%, B= |\/2n 334 — Ya2; 
k=1 k=1 ‚köi=), 
k+j 
gilt. Die Transformation (9.5.3) ist also nicht einsindaukrg: jedem System 
(21, 295 ---, Zn, ©, $), wobei 
n—2 


n—2 
s>0, Ya+0 und Ya<e, 
k= 


k=1 


26* 
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entsprechen zwei Systeme (X, %3 ..., %,), nämlich das System 
. =E+s2% (k=1,2,...,0n— 2), 
—B 
1 =Etts 5 
u r (9.5.7) 
n=its An 
2 
und das System . 
. =EH+s% (k=1,2,..,n—2), 
” A-+B 
A =EH+Ss A = 
Zee (9.5.8) 
en, AR 
„R=tts 2 


Wir bemerken, daß die Funktionaldeterminanten beider Transformationen den 
gleichen absoluten Wert haben, da die eine Transformation aus.der anderen 
durch Vertauschung von x,-, und x, hervorgeht. Wir erhalten für die Trans- 
formation (9.5.7) 


BR ‚A Aa | 1 1 
08 0% 
0% ÖLn in F A—B A+B 
ds ... ds ı ya, 2n—2 92 P 
lm 2m, 0..0 2[4_22\ (24,28 
2 8m, 5 2\02, 92, 2 \02, 92 
02 Ian ek sa s[2A __8B\s [284 öB 
One One he Ama 2 Ama 


Nach einigen elementaren Umformungen finden wir 
J|=ks. 


Dabei ist k=k(2,, ..., 21.2) eine gewisse Funktion, die nicht von X und s abhängt. 
Wenn wir noch beachten, daß die Dichte auf der rechten Seite von (9.5.2) den 
gleichen Wert für beide Transformationen (9.5.7) und (9.5.8) hat, und auf jede 
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dieser Transformationen die Formel (2.9.3) anwenden, dann erhalten wir aus 
(9.5.2) 


dP = 9%; S, Zyy o0.; 2n-2) dtds dz, LET AR 


| n&2 - ns? 


ar 
20? 


sk dä ds d2,---daua. (9.5.9) 
Dabei ist 
98, S, Ay eren 2n-2) 
. die Dichte der Zufallsvariablen 
X.8.2,.,., Ze): 


Ein Vergleich mit dem Beweis der Formel (2.4.14) erleichtert dem Leser das 
Verständnis für die Herleitung der Formel (9.5.9). 
Wir wollen nun (9.5.9) in der folgenden Gestalt schreiben: 


IE, 8, 21 --- > Zn) dE ds dz, due 


r( _ ) 

_ = : 

= Yn exp (- 2) däö.-Cds- a (213 +:., Zn) d2ı dena 
o Pi 


= — z Pr 
oy2r - 
, Y n? TC 2 
mit 
n—1 
E 2 
u ns 
n ? "—"expl— — 
20? L 


Hiermit ist das Wahrscheinlichkeitselement der Zufallsvariablen 


RS Ze De) 


gleich dem Produkt dreier Faktoren. Der erste Faktor ist das Wahrscheinlichkeits- 

element der Zufallsvariablen X, der zweite das der Zufallsvariablen 8, während 
der dritte.das Wahrscheinlichkeitselement der Zufallsvariablen (Z,, ..., Zu-2) ist. 
Somit sind nach (2.8.5) die Zufallsvariablen X, 8 und (Z,,...., Z,-2) unabhängig. 
Wenn wir mit h (2, s) die Dichte der Zufallsvariablen (X, $) bezeichnen, erhalten wir 


| ee 


h(&,s) =! oY2n 20? 


ES 2 Ze SEES 
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B. Wir wollen jetzt die Verteilung der Stichprobenfunktion U = 82 finden. 
Zu diesem Zweck substituieren wir im zweiten Faktor auf der rechten Seite von 
(9.5.10) u—=s2. Da s > 0 ist, ist die Transformation % = s? eineindeutig, und nach 
(2.4.19) ist die Dichte der Stichprobenfunktion U gleich 


ga (9.5.11) 


lo für u<0. 


Wir betrachten jetzt die Zufallsvariable Z = nS? =nU. Wir bezeichnen ihre 
Dichtefunktion mit f,(z) und erhalten 


z2e 
E=7 für 2>0, 
ha=ı22 Tr (* — - or (9.5.12) 
2 
L 0 für z<0. 
Vergleichen wir (9.5.12) mit der Formel (9.4.4), die uns die Dichte der Zufalls- 
variablen 
Rn 
2=3X 
k-1 


angibt, so sehen wir, daß die Zufallsvariable Z dieselbe Verteilung wie die Zufalls- 
variable y? mit » — 1 Freiheitsgraden hat. Die Formel (9.5.12) kann man nämlich 
aus (9.4.4) erhalten, indem man überall » durch n — 1 ersetzt. Dieses Ergebnis 
stimmt mit der Anschauung überein; denn die Zufallsvariable 4? ist nach Defi- 
nition eine Summe von z unabhängigen Zufallsvariablen, während 
n 
n = 3 (%,— X) 


a 7=11 
eine Summe von n Zufallsvariablen ist, die der Gleichung 
n = 
AL =nX 
k=1 


genügen. Durch dieses Ergebnis können wir den Begriff des Freiheitsgrades 
besser verstehen. 


Aus (9.4.5) erhalten wir 


E(nSY) = (n—1)0, D!(n$?) = 2(n — 1) o®. 
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Hieraus folgen die Gleiehungen 


u EI Eu) 


E(S?) = of. | 9.5.13) 


C. Wir wenden uns nochmals dem Ausdruck (9.5.10) zu und sehen: Haben die 
unabhängigen Zufallsvariablen X, die gleiche Normalverteilung, dann ist die 
gemeinsame Dichte der Zufallsvariablen X und 8 gleich dem Produkt der Dichten 
dieser Zufallsvariablen. Diese Zufallsvariablen sind also nach (2.8.5) unabhängig. 
Dieses äußerst wichtige Ergebnis stammt von FisHer [5]. Es hat folgende prak- 
tische Bedeutung: Liegt eine Serie von unabhängigen einfachen Stichproben vor, 
die alle aus derselben normalen Gesamtheit stammen, und teilen wir diese Serie 
so in Gruppen ein, daß ein und derselben Gruppe alle diejenigen Stichproben an- 
gehören, für die die berechneten s-Werte gleich (oder angenähert gleich) sind, 
dann ist in jeder dieser Gruppen die Häufigkeitsverteilung der &-Werte, die zu 
irgendeinem festgelegten Intervall gehören, in Annäherung dieselbe. Ebenso kann 
man die Stichproben hinsichtlich der z-Werte gruppieren; auch hier ist die Häufig- 
keitsverteilung der s-Werte, die zu irgendeinem festgelegten Intervall gehören, 
in jeder dieser Gruppen angenähert die gleiche. 

Auch der umgekehrte Satz erwies sich als richtig: Sind die Stichprobenfunktionen 
X und S unabhängig, dann sind die Zufallsvariablen X, normal verteilt. Den 
Nachweis lieferten GrAary [1], Lukacs [1], KawAra und SAkAamoro [1] und 
Zineer [1]. Später haben Lukacs [2] sowie Basu und Lana [1] diesen Satz ver- 
allgemeinert. 


Beispiel 9.5.2. Einer Gesamtheit, deren Merkmal X normal N(1;2) verteilt ist, ent- 
nehmen wir eine einfache Stichprobe, die 12 Elemente enthält. Dabei werden die folgenden 
Werte der Zufallsvariablen X beobachtet: 


s=20, 8 =25, 3-05, ,=10, 5-00, = —0,9, 
51, = -15, 8=08, Zu=hbl um 08,. La = 04. 
Hieraus erhalten wir 


1 2 1 
= — = 0,98, — 7° = 2,69. 
En 2 k $? er: 34 = 
Es gilt dis 2—= ns? = 125? = 32,28. Wie groß ist die Wahrscheinlichkeit dafür, daß die 
Zufallsvariable Z nicht kleiner als der beobachtete Wert z = 32,28 ist? 

Wie wir wissen, hat die Zufallsvariable Z eine y?-Verteilung mit 11 Freiheitsgraden. Be- 
rücksichtigen wir, daß die Standardabweichung der Zufallsvariablen X gleich 2 ist, so können 
wir die Wahrscheinlichkeit P(Z = 32,28) für 11 Freiheitsgrade aus den Tafeln für die x?- 
Verteilung ablesen. Dabei interpolieren wir wie in Beispiel 9.4.2: 


32,28 
4 


ns? 
P(Z > 32,28) = P (= > ) = P(y? > 8,07) » 0,70. 
e 
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9.6. _ Die Studentsche z-Verteilung 


A. In 9.4 betrachteten wir die Verteilung der durch 


were, 
Nr 
gegebenen Stichprobenfunktion unter der Voraussetzung, daß die Zufallsvariablen 
X, (k=1,2,...,n) unabhängig sind und die gleiche Normalverteilung N (m; o) 


besitzen. Dabei stellten wir fest, daß X normal N (m: -.) verteilt ist. Die Ver- 


n 
teilung der Zufallsvariablen X ist also für ein gegebenes m unbekannt, wenn o 
unbekannt ist. Hier können wir offenbar nicht den aus der Stichprobe errechneten 
Wert s als o nehmen, denn $ ist eine Zufallsvariable, die im allgemeinen in ver- 
schiedenen Stichproben verschiedene Werte annimmt. Um den Parameter m bei 
unbekanntem o abschätzen zu können (vgl. Kap. 13), ist es notwendig, eine 
Stichprobenfunktion zu betrachten, die eine Funktion von m ist und deren Ver- 
teilung nicht von « abhängt. Dieses Problem löste GosseEr (er schrieb unter dem 
Pseudonym STUDENT), indem er eine Stichprobenfunktion einführte, die wir mitt 
bezeichnen und nach STUDENT benennen. Wir definieren sie folgendermaßen: 

Es seien X, (k=1,2,...,n) unabhängige Zufallsvariable mit der gleichen 
Normalverteilung N (m; o). Wir definieren!) 


= m-1, (9.6.1) 


wobei die Zufallsvariablen X und S durch die Formeln (9.5.1) bestimmt sind. 


Wir bestimmen zuerst die Dichte f(v) der Zufallsvariablen 7 = al, 


Aus (9.5.10) folgt, daß diese Zufallsvariable V der Quotient zweier unabhängiger 
Zufallsvariabler ist und daß die Dichte des Zählers bzw. die des Nenners die Form 


oV2r 20? 
bzw. 
5 FF = 
fa) = ——————— (9.6.2) 
n—3 1 
227T (* — ) Pu 
2 


1) Aus traditionellen Gründen wollen wir im Gegensatz zu der sonst von uns benutzten 
Bezeichnungsweise die Studentsche Zufallsvariable t und ihre Werte mit demselben kleinen 
Buchstaben £ bezeichnen. 
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haben. Wir erhalten also aus (2.9.16’) die Dichte der Zufallsvariablen V in der 
Form 


Pr n— ns? 
Yn nv?g? I n-2 7 5 
N ar N 8 e 
fw) = ———e e sds 
o Y2r = [a—1\ 
0 22T 3 o" 
n © 
n®. R ae 
Be a ee erh e 2 gn-ids. 


er n—1 
BERTenE 


Im Integral substituieren wir 2 = s? und erhalten 


“E _mWw’+1) n—2 
fw) = — m Je = 22 de. 
Be en | ME 
ir): 
Wenn wir in (5.8.5) 
rw +1) _n 
= Kr FT und 2 = 5 


setzen und beachten, daß 7’ () = x ist, erhalten wir nach einigen Umfor- 
mungen 


a 2 a 
Fi) = —— tn —! 


nn nn Bene, (9.6.3) 
ers 
Man kann den Ausdruck (9.6.3) in der Form 
I) = — ——, (-o<v<o) (9.6.4) 
35 ; ) (v2 +1)? 


schreiben. Aus (9.6.4) ergibt sich, daß die Dichte g(f) der durch (9.6.1) gegebenen 
Zufallsvariablen ? die Form 


hat. 
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Die Dichte der Studentschen Zufallsvariablen ti ist also nicht von o abhängig. 
Diese Tatsache hat, wie wir schon oben erwähnten, viele Anwendungen der t-Vertei- 
lung zur Folge. Wir wollen sagen, daß (9.6.5) die Studentische t- Verteilung mit n— 1 
Freiheitsgraden bestimmt. Die Dichte der Zufallsvariablen # ist symmetrisch in 
bezug auf den Punkt t —=0. 

Für die Studentsche t-Verteilung existieren nur die Momente der Ordnung 
k<n— 1. So existieren zum Beispiel für n =1 überhaupt keine Momente. 
Wie der Leser nachprüfen möge, ist für n = 2 die Studentsche t-Verteilung ein 


su} 


Abb. 9.6.1 


wa? Fu? 5507 Zune ar er u Sr 


Sonderfall der Cauchyschen Verteilung, die, wie wir wissen (vgl. 5.10), keine end- 
lichen Momente besitzt. 
Die Wahrscheinlichkeit, daß t im Intervall (f,, £,) enthalten ist, wird durch das 


Integral 
b 


1 di 


'in—i rw \r 
_1BI- 
t 


2 


Pl, <t<t)= 


ausgedrückt. Abb. 9.6.1 stellt die Studentsche £-Dichte für n =3 dar. 
Denken wir an den Beweis der Formel (9.6.5) und definieren wir die Zufalls- 
variable U durch 


9.6.0) 


wobei Zund W unabhängige Zufallsvariable sind, Z die Normalverteilung N (0; 1) 
und W eine y2-Verteilung mit r Freiheitsgraden besitzt, so sehen wir leicht, daß 
U die Studentsche t-Verteilung mit r Freiheitsgraden hat. 


B. Vergleichen wir die Tafeln der Studentschen t-Verteilung mit 30 Freiheits- 
graden mit der entsprechenden Tafel der Normalverteilung, so stellen wir fest, 
daß beide Teile beinahe identisch sind. Dies ist deshalb so, weil die Studentsche 
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t-Verteilung ziemlich schnell gegen die Normalverteilung konvergiert, wenn die 
Anzahl der Freiheitsgrade ins Unendliche wächst. Es gilt nämlich der folgende 
Satz! 


Satz 9.6.1. Die Folge {F„(f)} der Studenischen t-Verteilungsfunktionen mit n 
Freiheitsgraden genügt der Beziehung 


im Fu = = |< "at (9.6.6) 
RX y2 PA 


Beweis. Wir schreiben die Formel (9.6.1) in der Gestalt 


n 
= Le 
n er Vz. N; 
(n — 1)o® @ 


Wie wir wissen, ist für jedes natürliche 2 die Zufallsvariable Y, normal N (0; 1) 
verteilt. Wir beweisen, daß die Folge {V,„} stochastisch gegen 1 konvergiert. 
Tatsächlich hat die Zufallsvariable n 8? eine Gammaverteilung mit p = — 


und b= = Die charakteristische Funktion 9,(&) der Zufallsvariablen Z, 
o 
ist somit nach (5.8.8) gleich 


ia \_rZ1 
2 


ee 
Pn(&) ei 


2 


Daraus erhalten wir 


lim o,(&) = e*. 
no 5 
Aus der letzten Gleichung folgt, daß die Folge {Z,} und somit auch die Folge 
{V„} stochastisch gegen 1 konvergiert. Aus der Behauptung 6) des Satzes 6.14.1 
erhalten wir die Gleichung (9.6.6). 


C. Allgemeiner als die Studentsche 1-Stichprobenfunktion ist die nichtzenirale t- 

Stichprobenfunktion. Diese Stichprobenfunktion definieren wir folgendermaßen: 
Es seien X, (k=1,2,...,n) unabhängige Zufallsvariable mit der gleichen 

Normalverteilung N (m; o). Als nichtzentrales t bezeichnen wir den Ausdruck 


y- ni; 
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dabei sind X und S durch die Formeln (9.5.1) bestimmt, während %, irgendein 
konstanter Wert ist. 

Die nichtzentrale i-Stichprobenfunktion unterscheidet sich vom Studentschen 
i dadurch, daß an Stelle des Mittelwertes der Zufallsvariablen X im Zähler ein 
beliebiger Wert x, auftritt. Es ist klar, daß für x, = m die Zufallsvariakle Y mit 
der Studentschen i-Stichprobenfunktion übereinstimmt. 

Die Herleitung der Dichte der Zufallsvariable Y ist ähnlich der der Formel (9.6.5). 
Diese Dichte hat die Form: 


Pr} ö ee 
i(y) Sl U an a BRFRET 
Wire 
x 
x - e ® s | 23 " du 
Sr Ale 
n— 
-Qy 
Vr+n-1 
(9.6.7) 
Dabei ist Q ein durch 
= m T_%g 
c 


bestimmter Parameter. Ist x2,= m, also Q = 0, so geht (9.6.7) in (9.6.5) über. 

Umfangreiche Tabellen für die nichtzentrale i-Verteilung haben ReswıkorF 
und LIEBERMANN [1] herausgegeben; HARLEY [1] sowie MERRINGTON und PEAR- 
son [1] haben eine Näherungsformel für diese Verteilung angegeben. 


. D. Wir geben noch eine Stichprobenfunktion an, die dieselbe Verteilung wie die 
Studentsche i-Stichprobenfunktion hat und große Bedeutung für die Anwendungen 
besitzt. 

Es seien X,,X,...,X, und Y,Y,..., Y,, unabhängige Zufallsvariable 
mit derselben Normalverteilung N (m; 0). Wir setzen 


= 1 a > 1” 
em Ay Fey In 
N, k-1 Na ı=1 


1 Ni Zu Na ER 
2-2 3m,-I, 8= Sn Tr. 
Ngı=ı 


N, k=1 


Wie bekannt, haben X bzw. Y die Normalverteilungen 


(m) bzw. \ (m 2). 
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Die Zufallsvariable a: hat folglich. die Verteilung - 


N (0 c yasa + ") ; 
NıNg 


Daraus folgt, daß die Zufallsvariable 


te Y Milz (9.6.8) 
° Nı N 


die Verteilung N (0; 1) hat. Die Zufallsvariable 


2 2 
NS, +N.8, 
02 


W= (9.6.9) 


hat eine y?- NereHune mit n,-+ nz — 2 Freiheitsgraden. Dies folgt aus dem 
Additionssatz für y? und daraus, daß die Zufallsvariablen S? und 8? unabhängig 
sind. 


Wir betrachten die Zufallsvariable 


xX-Y MN 
Ve m+m-2 


” Yn, 8 +n285 17% 
_ Z 
wm +m;—2% 


wobei Z bzw. W durch die Formeln (9.6.8) bzw. (9.6.9) definiert sind. Vergleichen 
- wir (9.6.10) und (9.6.1’), so sehen wir, daß U die Studentsche t-Verteilung mit 
N + Ne — 2 Freiheitsgraden hat. Weiterhin sehen wir, daß die Verteilung der 
Zufallsvariablen U sowohl von m als auch von o unabhängig ist. Dieses Ergebnis 
stammt von FISHER [5]. 


(9.6.10) 


E. Eine Verallgemeinerung der Studentschen t-Verteilung (oder genauer der 1?- 
Verteilung) auf mehrdimensionale Zufallsvariable ist die 7®- Yertalung von 
Horerring [2]. 

- Es seien die X, = (X, Xu Xu) (k=1,2,...,n) unabhängige r-dimen- 
sionale Zufallsvektoren mit gleicher Normalverteilung. Ferner sei m; = E(X,) 

und A, = EX — m) (Xu — mı)] 3 = 1,2,...,r), wobei die Matrix M der 

Varianzen und Kovarianzen die Determinante |M|-==0 hat. 

Wir setzen ferner 


n 1 
X=- 
n 


TM« 


Xu, (9.6.11) 


a 
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12, u = 
Wu = Fi I (Ku X) Au — L:); (9.6.12) 
k=1 
W1---Wır 
daliseee] (9.6.13) 
Wı-..Wır 


Die W,; nennen wir die Stichprobenvarianzen (für j —i) sowie die Stichproben- 
kovarianzen (für ji), und @ bezeichnen wir als die Matrix der Stichproben- 


momente zweiter Ordnung. 
Den Ausdruck 


19! 
DS 
=; Pan 


wobei |Q| die mit der Wakticheiäliehkeit 1 von 0 verschiedene Determinante der 
Matrix Q und |Q;;| das algebraische Komplement zu W,,; in der Determinante der 
Matrix @ ist, nennen wir die Hotellingsche T’?-Verteilung. 

Die Dichtefunktion g(y) der Variablen 7’ ist definiert durch 


Km) (X, — m), (9.6.14) 


f ( y )" 1 
9Yy) = Te EEE Er für y>d, (9.6.15) 
BE. _ 1+ —— 
ee) 


0 für y=0. 


Den Beweis der Formel (9.6.15) findet der Leser bei SCHMETTERER [1] oder bei 
CRAMER [2]. 

Es sei bemerkt, daß die Dichtefunktion (9.6. 15) von den Momenten zweiter 
Ordnung A,; der Zufallsvektoren (Xja, X, ---‚ Äyr) unabhängig ist. Wir sagen, 
T2habe n — 1 Freiheitsgrade. 

Die Hotellingsche 7?-Verteilung spielt in der mathematischen Statistik im Fall 
der Beobachtung von Zufallsvektoren die gleiche Rolle wie die Studentsche t!- 
Verteilung im Fall der Beobachtung eindimensionaler Zufallsvariabler. 


9.7. Die Fishersche Z-Verteilung 


Es seien X, (k=1, 2,...,2,) und Y, (=1,2,...,n,) unabhängige Zufalls- 
variable mit derselben Normalverteilung N (0; 0). Wir setzen 
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und bilden die Stichprobenfunktion 
S, 

-=-. 9.7.1) 

S, 


Nach Voraussetzung sind die Zufallsvariablen $, und $, unabhängig, “und ihre 
Dichten sind nach (9.5.10) durch 


ma Zu 
fi (si) = En re für £7 > 0, 
g3ırT 5) Pr! 
2 
L 0 für 5 s 0 


(? = 1, 2) bestimmt. Nach (2.9.16’) ist die Dichte der Zufallsvariablen U durch die 
Funktion 


x 


2 
| N exp |- z (n, u? + | ds, für u> {l) 
0 . E 


— 2 2 
iu u mit C,, Na = Hrn a . 2 
8 er n„,—1 r n—1 gutne-2 
2 3 
0 für vs0 (9.7.2) 


dargestellt. Wir setzen y=s3 und erhalten 


x NıtNa ai 2% 
(u) = r Ru 2 "exp (- en ») dy für u>0, 
= © 

0 


0 für u=<0. 


Wenn wir die Formel (5.8.5) benutzen, in der wir 


Nu? + N, N, + Ne 1 
— p= _ 


setzen, so finden. wir 


rl R—1 
& he N, +0 ; i 
| nn? n?:T (5 _ ) mil 


uam? (2 0?) 2 


ntne ; matm 


für # > 0, 


0 für v<s0. 
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Nach Einführung von B(p, g) ergibt sich 


aı-1l %-1 


am en en in ee 
u „-ln—1 nıtme _ x 
fu) =| B ee: FL 2 2 ) (mu +n) ? 2 (9.7.3) 


0 für u<s0. 


Der Ausdruck (9.7.3) hängt nicht von c ab. Wir setzen 


u= Fe e (-w<2<o): (9.7.4) 
NN — 1) 


Dann gilt 


Al NRe-l 


3) = mt Fe emr—ı 1 ne 
B en, n,(n, — 1) ; na ee 1 
2 2 N. — 
m-1 Mi 
_ 2m? ml)? en) 


„-l1m-—i BitNa).. 
2, 2) Me tm, U: 


Wennwirnn =n—Lrz=n —1 setzen, erhalten wir 


2 2 ö rı2 
_ in 2 (-0<z<o). (9.7.5) 


rıtra 


B (3: 5) (ne® +7) ? 


Die Stichprobenfunktion Z, die mit der Stichprobenfunktion U durch die Formel 
(9.7.4) zusammenhängt, nennt man die Fishersche Z-Stichprobenfunktion (vgl. 
Fısner [7]). Das Zahlenpaar (r,, r,) bezeichnet man als Freiheitsgrad der Fisher- 
schen Z-Stichprobenfunktion. 


Die Zufallsvariable 
F = exp (2Z) 


heißt Snedecorsche F-Stichprobenfunktion. Ihre Dichte läßt sich aus der Formel 
(9.7.5) herleiten. 
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Wir zeigen jetzt an einem Beispiel, wie die Fishersche Z-Verteilung in der 
Praxis angewandt wird. 


Beispiel 9.7.1. Wir untersuchen eine Warenmenge. Das Merkmal X dieser Waren sei 
normal verteilt, die Standardabweichung dieser Verteilung aber unbekannt. Wir entnehmen 
zwei unabhängige einfache Stichproben. Die eine Probe habe den Umfang n, = 5, die zweite 
den Umfang n, = 6. Die Standardabweichung betrage in der ersten Stichprobe s, = 1,3 
und in der zweiten s,==1. Da beide Stichproben aus derselben Gesamtheit (Warenmenge) 
stammen, kann man erwarten, daß sich s, nur wenig von s, unterscheidet. Nun zeigte es 


8 ; 

sich jedoch, daß — = 1,3 ist. Wir fragen nach der Wahrscheinlichkeit dafür, daß in zwei 
92 S, 

Stichproben, die aus derselben normalen Gesamtheit stammen, das Verhältnis — nicht 


kleiner als der beobachtete Wert 1,3 ist. ® 

Diese Frage wollen wir mit Hilfe der Fisherschen Z-Stichprobenfunktion beantworten. 
Den Wert u = 1,3 betrachten wir als beobachteten Wert der Stichprobenfunktion U, die 
durch (9.7.1) bestimmt wurde. Aus (9.7.4) erhalten wir 


% 1,3 
= log ———— log ——— 3 0,2826. 
Nr — 1) y0,96 B 
j N,(n, —1) 


Dies ist der beobachtete Wert der Fisherschen en Z, deren Freiheitsgrade 
durch das Zahlenpaar (4, 5) gegeben sind. 
Wir stellen die Frage: Ist die Wahrscheinlichkeit von U > 1,3 nicht kleiner als 0,05? _ 
Aus der Tafel VI lesen wir den Wert z, ab, für den die Relation P{Z=z,) = 0,05 gilt; 
er beträgt 2, » 0,8236. Da der von uns beobachtete z-Wert nur 0,2826 beträgt, können wir 
die gestellte Frage bejahend beantworten. 


Bei Durchsicht des Beweises für die Formel (9.7.5) sehen wir, daß die durch 


U 1002: ) 


2 nr N 


definierte Zufallsvariable U eine Fishersche Z-Verteilung mit (r,, r,) Freiheits- 
graden hat, wobei W, und W, unabhängige Zufailsvariable sind; W,;, ( =1,2) 
hat dabei eine z?-Verteilung mit r; Freiheitsgraden. 

Es möge W, eine nichtzentrale 4°-Verteilung mit dem, Nichtzentralitätspara- 
meter 7? und r, Freiheitsgraden sein (vgl. 9.4.B), und W, habe eine y?-Verteilung 
mit r, Freiheitsgraden; ferner seien W, und W, unabhängig. Die Zufallsvariable 


MW 


rt, 1% 


F= 


heißt die nichtzentrale Snedecorsche Stichprobenfunktion F, und entsprechend 


bezeichnet man den Ausdruck Z = 5 log F als die nichtzentrale Fishersche 


237 Fisz 
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Stichprobenfunktion Z. Die Dichtefunktion g, (2) der nichtzentralen Fisherschen 
Stichprobenfunktion Z läßt sich aus (2.9.16), (9.4.4) und (9.4.11) ermitteln und hat 
die Gestalt 


1 ; 1 $ 
Yyrıl? yralß 1 &. (; en) 7 © tr)+ ) 
ep (- 2 re) Dre ee 
TIl=r = Por +jline® +, tet 
2 2 I 9 1 2 


Für ??=0 geht die letzte Gleichung über in (9.7.5). 


Me) = 


9.8. Die Verteilung von X in Stichproben aus einigen niehtnormalen Grund- 
gesamtheiten 


Bisher haben wir uns mit Stichprobenfunktionen befaßt, die Funktionen von un- 
abhängigen Zufallsvariablen X,,..., X, waren, wobei alle X, dieselbe Normal- 
verteilung hatten. Jetzt wollen wir uns mit Stichprobenfunktionen beschäftigen, 
die über nichtnormalen Grundgesamtheiten definiert sind. 

Die unabhängigen Zufallsvariablen X, (k =1,2,...,5j) mögen alle dieselbe 
Binomialverteilung haben, deren Wahrscheinlichkeitsfunktion für r =0,1,..., 
durch 


Pin (re 


gegeben ist O<p<1l,g=1-—p). Wir wollen die Verteilung des arithmeti- 
schen Mittels 


= ; 
yo X, (9.8.1) 
3 


dieser Zufallsvariablen bestimmen. 


Aus (5.2.3) folgt, daß die charakteristische Funktion der Zufallsvariablen X, 
für jedes ‚k =1,2,...,j durch 


el) = (4 + pet)" 


bestimmt ist. Nach (4.2.15) und .(4.4.3) hat die charakteristische Funktion der 
Zufallsvariablen X die Form 


| All) = PB = W (9.8.2) 
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Dieser Ausdruck stellt die charakteristische Funktion einer Zufallsvariablen mit 
einer modifizierten Binomialverteilung dar; die Zufallsvariable X kann die 
Werte 


annehmen. 
Wir betrachten nun die unabhängigen Zufallsvariablen 


X, (k=1,2,...,j), 
die alle die gleiche, durch 
ar 
P(X,=r) =et— (r=0,1,2,...;4>0) 


r! 


bestimmte Poissonsche Verteilung haben mögen. 

Um die Verteilung der durch (9.8.1) bestimmten Stichprobenfunktion X zu 
finden, beachten wir, daß nach (4. 2. 6) die charakteristische Funktion der Zufalls- 
variablen X, für jedes & durch 


pl) = ei 


bestimmt ist. 


Nach (4.2.15) und (4.4.3) hat die charakteristische Funktion der Zufallsvaria- 
_ blen X die Gestalt 


0 = exp ja (er - )] 


Dieser Ausdruck stellt die charakteristische Funktion einer Zufallsvariablen. mit 
einer modifizierten Poissonschen Verteilung dar; X kann die Werte ' 


0, I. 


12 
2.7 


mit den Wahrscheinlichkeiten 


e(X=;) ZZ l=0,1,2,...) 


annehmen. 


27* 
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/ 


9.9. Die Verteilung der Momente und des Korrelationskoeffizienten in einer 
Stichprobe aus einer normalen Grundgesamtheit 


Wir betrachten die zweidimensionale Zufallsvariable (X, Y), die normal verteilt 
sei. Ihre Dichte sei durch 


a 1 en 1 (x — mı)? 
fe, y) 270,0, Yi — & or | 2(1— 0%) | 0) 
_2 e(& — mı) (y — my) + (y zu; (9.9.1) 
0109 05 


gegeben. In dieser Formel sind m, und m, die Mittelwerte der Zufallsvariablen X 
und Y, o, und o, sind ihre Standardabweichungen, und o ist der Korrelationskoef- 
fizient der Zufallsvariablen X und Y. 

Wir betrachten die Stichprobenfunktionen 


k=1 k=1 
1.8 er 1.8 
=) 3X), = - 2-7) 
N x N k=1 
und 
n — -- 
2 &-X) Nr —P) 
R= k=1 i . 
nS,S, i 
dabei sind (X, Y,), k=1,2,...,n, unabhängige zweidimensionale Zufalls-- 


variable, deren Dichte durch (9.9. N bestimmt ist. 
Hier sind X und Y Mittelwerte der Stichprobenfunktion X und Y. Analog sind 
8, und S, Standardabweichungen der Stichproben der Variablen X und Y, 
während R der Stichprobenkorrelationskoeffizient der Variablen X und Y ist. 
Fısmer [2] und Romanowsky [1] haben bewiesen, daß die Dichtefunktion : 
der gemeinsamen Verteilung der Zufallsvariablen (X, Y, 8,, 8,, .R) folgende Form 
hat (wir geben sie ohne Beweis an): 


I@; 7, s% $9, r) == ur, Y)v(sı, S2; r), 
wobei 


ug, y)= 


n N (2 — m,)* 
270,09 yı — 0? 2(1 — 0°) 7. 


„nee RT), =, (9.9.2) 


0105 o2 
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n=4. 
nase ln)? 5 
rI(n — 2) — 
[11 — e®)] 


v(81, 82 r) — 


N 
x exp I- 2002 (1 — 0°) [o?s? — 2070,03818: + al (9.9.3) 


für, >0,,>0,r?<1 und v(s,s,r) = 0 im übrigen Gebiet von (s;, Sz, r) ist. 
Damit hat (X, 12) eine zweidimensionale Normalverteilung mit 


EX) =m, Ei)=m, DX)=%, nn) -® 
N 


während der Korrelationskoeffizient der Zufallsvariablen X und Y gleich g ist. 

Aus dem Fisher-Romanowskyschen Satz ergibt sich die äußerst wichtige 
Folgerung, daß die Zufallsvariable (X,Y) von der Zufallsvariablen (S,, 8, R) 
unabhängig ist. Wir beachten, daß wir aus (9.5.13) für =1,2 


Bis = ol, 
D2($?) = 2n — 1) of 
n2 


erhalten. 
Mit f{r) sei die Dichtefunktion der Zufallsvariablen R bezeichnet. Wie in 3.6.F 
setzen wir |M| = o1o3(1 — 0?) und erhalten aus (9.9.3) die Beziehung 
Ark: 
nr (i BZ, r?) 2 
n—i 


an —2)]M| 


In = 


X 00 
nr . 
‘x IB; ge er - [dt aa ds, ds,. 
66 


2|M| 

Da 

ex Se a) = Sa ern) 

P imj° 1038192 ne 1038192 
ist, gilt 

ne 
i wall): © j © ” ae: 

= Taf, In ine“ ) a re) de 


al(n—2)|m|?® 


0 


>) 2 N 
x f 32*jexp (- Sm] a) ie e 
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Wenn wir 2, =s! und 3=8 setzen und (5.8.5) benutzen, erhalten wir nach 
Integration 


EEE 25 - = & „[a+j—1\ 2er) 
Meer.) 


Wir machen von der Formel 


ri =2renB(n.;) 


2 
Gebrauch und setzen p = u ‚ um 
“Sr (+3= ) (2er) 
;=0 2 VE 


1 
en) En .. 2+j-3 BERE 3 
ee *) er ® (1-2) ?dz 
j=0 
0 


--2(y (" es ) (erayar? (1 — a9)” 3 da 


27-3 j=0 
0 


zu erhalten; dabei substituierten wir 2 = x?. Da 


se 


ze 
(1 — ore)" 


”) (era) = 


j=0 
ist, ergibt sich 
1 
< 4) (2er)! el a2 
DR | ——— | = | PU dr. 
3 | 2 3! 273 (1 —orayı Y1 — a2 


Enndgültig erhalten wir also 


n—2 ni n—4 gn-2 
Ir) = 1-09)? (1—r): f — der. (9.9.4) 
” (1 -orepıy1 — a2 


Bei festem n hängt die Verteilung des Koeffizienten R nur vom Korrelations- 
koeffizienten og der Zufallsvariablen X und Y ab. 

Verschiedene Werte von go ergeben verschiedene Verteilungen von R. Tafeln 
für die R-Verteilung bearbeitete Davıp [1]. 


Er 
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Wir wollen genauer den Fall go —=0 betrachten; für die zweidimensionale 
Normalverteilung ist dies mit der Voraussetzung der Unabhängigkeit von X und 
Y gleichwertig. Wir setzen in (9.9.4) o=0 und erhalten 


1 


n—4 " 1 
er Fazer f 21 a) * de. (9.9.5) 


IT 
o 


Substituieren wir 2 =x2, so folgt 


ne aa pr n-1_, Eu 
rn) = 5 de) IE 2 (1-2)? da 
. 


n—4 


(1-1r)®. (9.9.6) 


el nl u 


In (9.9.6) setzen wir 


je — en 2 sa depe m, 9.9.7) 
1l-r es 2 
n—2 
. Dies ergibt 
1 1 i 1 
n—21 2 \ yn—2 m \3 
B ‚=) 11 1 
| 2 ) (1 +,5)° za: 
a - - (9.9.8) 
m; TEE TEN reger I. 
Yn—2 p[® 2 14 Pr \ 
2 2 n—2 
Vergleichen wir (9.9.8) mit (9.6.5), so sehen wir, daß die Zufallsvaria’ste 
u 
1—R 


im Fall o=0 eine Dichte hat, die mit der Studentschen t-Dichte mit n — 2 
Freiheitsgraden identisch ist. 


Beispiel 9.9.1. Die zwei Merkmale X’und Y einer Gesamtheit mögen eine zweidimensionale 
Normalverteilung haben und unabhängig sein. Wir entnehmen dieser Gesamtheit eine einfache 
Stichprobe vom Umfang » = 10. Aus den Stichprobenwerten von X und Y berechnen wir den 
Korrelationskoeffizienten r und erhalten r = 0,30. Wie groß ist die Wahrscheinlichkeit 
dafür, einen nicht kleineren r-Wert als den beobachteten zu erhalten? 
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Wir wenden die Formel (9.9.7) an und haben 


P(R > 0,3) -r( 204) = P(lt| > 0,889). 


[7 
y+r 
Aus den Tafeln der i-Verteilung mit 8 Freiheitsgraden lesen wir ab, daß die gesuchte Wahr- 


scheinlichkeit 0,40 beträgt. Die Schlüsse, die man hieraus ziehen kann, wollen wir in den 
nächsten Kapiteln besprechen. 


Die Formel (9.9.4) erlaubt uns selbstverständlich auch, die Momente der Zufalls- 
variablen R zu berechnen. Wir beschränken uns auf die Angabe der Näherungs- 
formeln 


E(iR)wo, DR)» —— (9.9.9) 


Die hier angegebenen Näherungsformeln kann man aber nur für genügend 
große n, d.h. für » > 500 benutzen, weil die Verteilung der Zufallsvariablen R 
sehr asymmetrisch ist. Diese Verteilung strebt zwar für n— oo gegen eine 
Normalverteilung; die Konvergenz geht jedoch sehr langsam vor sich. Beachtens- 
wert ist die von FISHER [3], [7] entdeckte Tatsache, daß die Zufallsvariable 


sogar für kleine n eine ee Normalverteilung 


ee nn) 
ee, Tre n—3 


B. Wir betrachten die l-dimensionale (> 2) Zufallsvariable (X, X, ..., X) 
mit einer Normalverteilung, deren Dichtefunktion durch die Formel (5.11.8) 
gegeben ist, mit den Erwartungswerten E(X,)=m; und mit den Varianzen 
und Kovarianzen E(X,— m,)(X,;, — m.) =4;, wobei die Matrix M der A, 
(,?=1,...,!) die Determinante |M|=+0 hat. Die Zufallsvektoren (Xu, .-., 
X.) mit k=1,2,...,n (n>!). seien unabhängig und mögen die gleiche Ver- 
teilung haben wie der Vektor (X,,X,, ...,.X,). Wir betrachten ferner die Mittelwerte 
der Stichprobenfunktion X,, die Varianzen und Kovarianzen der Stichproben- 
funktion W,, und die Matrix Q, die durch die Formeln (9.6.11), (9.6.12) bzw. 
(9.6.13) definiert sind. Die gemeinsame Verteilung des Vektors 


hat. 


(X, X, .. X, Win Win -.. Wi, W) 


wurde von WıstArr [1] gefunden. Er bewies, daß die Vektoren (X,,X PIRERE X)) 
und (W,» Wi» ---» Win,» Wu) unabhängig sind, wobei (X,X3,...,Xı) eine 
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 I-dimensionale Normalverteilung mit E(X,) = m; und 
E((X; — m) (X; — ,)) = An 


hat, während die Dichtefunktion 9 (wu, %ıa ..., Wı-,1, W,) des zweiten Vektors 
in dem Gebiet verschwindet, in dem die Matrix Q nicht positiv definit ist, und im 
übrigen Gebiet die Form 


(win, Win ---, Wı-1,ı Wu) 


i | ni I; 
zı-1)/A rG (n — 0) =2s (n — 0) 2TAE| 
x |Qje-'-2% exp (-5 II 33 2 lan) (9.9.10) 


hat, wobei |M,.| das algebraische Komplement des Ausdrucks A,; in der Deter- 
minante |M | ist. 

Die durch (9.9.10) gegebene Verteilung heißt die Wishartsche Verteilung. Neben 
dem geometrischen Beweis von WISHART findet man den analytischen Beweis der 
Formel (9.9.10) bei Hsu [2]. 

Das Analogon zur verallgemeinerten Varianz für die Grundgesamtheit (siehe 
6.3.F) ist die verallgemeinerte Varianz der Stichprobe, und zwar ist sie gleich der 
Determinante |Q| der Matrix der Varianzen und Kovarianzen der Stichprobe. 
Mit der Verteilung und den Momenten der Zufallsvariasblen |Q| haben sich 
Wiırks [1] und Kuunsack [1] beschäftigt. 


9.10. Die Verteilung der Regressionskoeflizienten 
ı 


In 3.7 und 3.8 zeigten wir, daß für eine normal verteilte zweidimensionale Zufalls- 
- variable (X, Y) die Regressionskurven erster Art Geraden sind, die mit den 
Regressionsgeraden zweiter Art identisch sind. Die Koeffizienten dieser Geraden 
sind durch die Formeln (3.8.4) bzw. (3.8.5) gegeben. Diese Formeln enthalten 
konstante Koeffizienten. In praktischen, statistischen Fragen sind diese 
Koeffizienten jedoch Zufallsvariable, und zwar Funktionen der Zufallsvariablen 
Y, 8, 8, und R. Wir betrachten also die Stichprobenfunktionen 
NP = I, > = 
A=RZ, B=Y-RZ=X=Y-aN. (9.10.1) 
8 S, 


Ähnlich erhalten wir für die Koeffizienten der zweiten Regressionsgeraden 


KR, B=-X-R&Y 


9.10.2 
5, 5, ( ) 


426 9. Stichprobenmomente und ihre Funktionen 


Die Verteilung des Zufallsvektors (X,Y, 8,,8,, R) sei durch (9.9.2), (9.9.3) 
gegeben. Wir bestimmen die Verteilung der Stichprobenfunktion A.. Zu diesem 
Zweck schreiben wir zuerst die Dichte g(s, s?, r) der Zufallsvariablen (ST, 8}, R) 
hin. Aus (9.9.3) erhalten wir sofort 


mr n—4 


ar) —— — on)? 


4aln—2)|M|? 


x expl— - - (51 — 20701035185 + 078) (9.10.3) 
2|M] 
mit 
IM=a35(1-e). 


Wenn wir die Zufallsvariable (S7, 8}, A) einführen, ergibt sich als ihre Dichte- 
funktion 


2 2 a" an n 
fa) Ss ——— zz (d - 2) ? exp (- Sa a) a 
4nTn — 2)|M]|® ar 
n 
x exp [- EIE7 (333 — 20 0,058 | $ (9.10.4) 


Da aus (9.10.1) folgt, daß $ — Ja?> 0 ist, integrieren wir (9.10.4) zuerst 
nach s? im Gebiet s? — sa? > 0 und dann nach s} im Intervall (0, 00). Wenden 
wir die Substitution y = s? — sja? an, so erhalten wir 

n—4 


(3 — sta?) ? exp 


N 
f (- u 8) de? 
s3-s]0’20 j IM 


n-2  n-2 exp (- ade) 

.- (9.10.5) 
Weiter haben wir 

n\ Er 

= TI-]>2 2 

ae no ARE ER 2)» IM] 
A SER m R rennt dt —  — ———. 
' ; n? (0 — 200,050 + 07a®)? 


(9.10.6) 
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Aus den Formeln (9.10.4) bis (9.10.6) erhalten wir nach Berücksichtigung der 
Identität j 


era (p+5) 
z 


die Dichtefunktion k (a) der Stichprobenfunktion A, nämlich. 


ja 


- ur ER 
Yar(® 5 E 2 (5 — 200,050 +07a2)? 


T@p) = 


h(a) = (9.10.7) 


Diese Formel gaben K. Pearson [3] und Romanowsky [2] an. Die Dichte- 
funktion A, (@’) der Zufallsvariablen A’ erhalten wir, indem wir einfach in (9.10.7) 
die Rollen von o, und o, miteinander vertauschen. 

Wir möchten es dem Leser überlassen, die Verteilung der Stichprobenfunktion 
B=Y-AX zu finden. Man braucht dazu nur zu beachten, daß (X, Y) eine 
durch (9.9.2) gegebene zweidimensionale Normalverteilung und A eine durch 
(9.10.7) gegebene Verteilung hat und daß die Zufallsvariablen (X,Y) und A unab- 
hängig sind. 

Wir bestimmen jetzt E(A) und D2(A). 

Zur Abkürzung schreiben wir 


2 
V = 0} — 200,034 + ola®. 


Wir beachten die Formel (9.10.7) und haben für n>2 


- © = 2, B 2 
E(4)=K ae ELLI ER BER 
A 20] u 0] a [21 
V: y? 2 
_o ee © = (9.10.8) 
Analog ist für n > 3 
x x x n oo 
2 
E(42)=K N. I da+ 29 K wen Is: 
Rs a er o Bi 1 a2 
y: v2 v: v: 


oo x 0 oo 
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Wenn wir noch berücksichtigen, daß aus (9.10.7) (wir setzennur n — 2 statt. n) 


Mi Verf?) 
ii i 2 Ä 
od a SE ee 


nn m 
v.?: T | ) IM)? 
2 
folgt, so ergibt sich nach einfachen Rechnungen 


5 1-40 +0" 
of n—3 : 


Daraus und aus (9.10.8) erhalten wir 


- a 1-9). - (9.10.9) 
Mittelwert und Dispersion der Zufallsvariablen 
B=Y-AX 
sind leicht zu berechnen, da wir schon die entsprechenden Momente der Zufalls- 


variablen Y, A und X kennen und außerdem wissen, daß (X, Y) und A unabhän- 
gig sind. Wir.erhalten 


E(B) =m, — em, (9.10.10) 
1 
| 2, _9_02 2 meli — o8 
| D2(B) = % n—2—g en a mie) (9.10.11) 
n n—3 a n—3 


Vernachlässigen wir in der letzten Formel die Glieder der Größenordnung unter 
n!, so ergibt sich 


2 
2 + mil — 9]. (9.10.12) 


la ver ri 


Sehr vorteilhaft ist die Substitution 


pe eg, (9.10.13) 
0, yı = 
wobei & =0 92 ist. Es gilt dann 
21 
BO42Ad—20,,A+0 , 


== 0» 
n—i IM| er 
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Aus (9.10.7) erhalttn wir damit für die Dichtefunktion f(f) der Zufallsvariablen : 
den Ausdruck 


il) = 1 1 1 


Yn-i,„[r ii mw \re" 
B ‚ıl1 2 
a 
‚Folglich hat die durch (9.10.13) bestimmte Zufallsvariable t eine Studentsche t- 
Verteilung mit n — 1 Freiheitsgraden. 
In der Formel (9.10.13) bestimmten wir die Zufallsvariable t als Funktion der 
Zufallsvariablen A und der Parameter o,, o, und e der Grundgesamtheit. In der 


Praxis kennen wir aber meistens die Werte dieser Parameter nicht. Von großer 
Bedeutung ist deshalb die von BARTLETT [1] festgestellte Tatsache, daß die durch 


die Formel 
= En (A-—.a) (9.10.15) 
8,1 — R: R? 


(9.10.14) 


1 


definierte Zufallsvariable t, eine Studentsche i-Verteilung mit n — 2 Freiheits- 
graden hat. Der Leser beachte, daß man aus (9.10.13) die Formel (9.10.15) erhält, 
wenn man die Parameterwerte o,, 0, und og durch 8, 8, bzw. R sowie n — 1 
durch » — 2 und t durch t, ersetzt. 

Den Beweis des Bartlettschen Satzes bringen wir hier nicht, di er leicht aus 
(9.9.3) hergeleitet werden kann. Dazu hat man nur die gemeinsame Verteilung der 
8, 8, und i, zu bestimmen und dann die Randverteilung von t, zu berechnen. 


911. ° Die Grenzverteilungen von Stichprebenmomenten 


In den vorherigen Paragraphen besprachen wir exakte Verteilungen von Stich- 
probenfunktionen. Diese Verteilungen zu finden, ist meistens sehr schwierig, und 
oft erhält man Formeln, die nur wenig praktischen Wert haben. Dagegen kann 
man ziemlich leicht die Grenzverteilungen einer umfangreichen Klasse von Stich- 
probenfunktionen angeben, die häufig in der Praxis vorkommen. Besitzt die 
Stichprobe einen genügend großen Umfang n, so nähert sich die Verteilung der 
untersuchten Stichprobenfunktion der Grenzverteilung, die man für n — oo er- 
hält. Hierauf beruht die Anwendbarkeit der Grenzverteilungen von Stichproben- 
funktionen. 

Die Ausführungen dieses Paragraphen finden ausschließlich bei genügend um- 
fangreichen Stichproben Anwendung. Es gibt keine für alle Stichprobenfunk- 
tionen allgemein. gültige Vorschrift, die vorschreiben würde, für welche n man eine 
Stichprobe als „groß“ ansehen kann. Wann eine Stichprobe „groß“ ist, hängt 
davon ab, wie gut die Verteilung der untersuchten Stichprobenfunktion gegen die 
Grenzverteilung strebt. 
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Es seien X,,X,, ..., X, unabhängige Zufallsvariable mit derselben Verteilung 
wie die Zufallsvariable X in der Grundgesamtheit. Wir nehmen an, daß das k-te 
Moment m, = E(X*) existiert, und untersuchen die Stichprobenfunktion 


Wir sehen, daß 
% 
E(A,) = —- IN E(X,) 
Nı=ı , 
gilt. Da nach Voraussetzung E(X =E(X) für r=1,2,...,n ist, haben wir 


B(A,) = - 3 BZ) — my. 


Die Stichprobenfunktion A, nennen wir das k-te Stichprobenmoment. Aus dem 
Chintschinschen Satz 6.11.4 folgt, daß für jedes & die Folge {A,} der Stichproben- 
momente stochastisch gegen das Moment m, der Grundgesamtheit konvergiert, 
falls n gegen oo strebt. Aus Satz 6.14.2 von SLutTskI folgt weiter, daß die Folge 
{By} der zentralen Stichprobenmomente, die durch 


1. 
B=— 3 (X — Ay) 


Rr—i 


definiert sind, für 2 — oo gegen das zentrale Moment 4, der Grundgesamtheit 
konvergiert. Somit konvergiert die Stichprobendispersion für na — oo stochastisch 
gegen die Dispersion der Gesamtheit. 

Setzen wir die Existenz des 2k-ten Moments ms, der Zufallsvariablen X voraus, 
so können wir eine Formel für die Dispersion der Zufallsvariablen A, herleiten. 
Für’ r=1,2,...,n gilt nämlich die Beziehung 


D2(X,) = D*(X*) = B(X®#*) — [E (X)? = mg, — my 
und wegen der Unabhängigkeit der Zufallsvariablen X,, X,, ..., X, die Formel 


n a 2 
D*(A,) = + y .D2(Xh) =, D2(&%) a Un. 


n?; 1 


1 


Aus dem Lindeberg-Levyschen Grenzwertsatz 6.8.1 folgt, daß für n— oo die 
Folge der Verteilungsfunktionen der normierten Zufallsvariablen 


SXx+ — NM 
Ve tal ern re 
n 7 ei r 
Yn.D:(X*) Va; — m? 


A, — Mr 
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gegen die Grenzverteilungsfunktion ® (x) strebt. Wir können also sagen: Existiert 
_ das endliche Moment n;, in der Grundgesamtheit, dann ist das Moment A, der 
Ordnung k asymptotisch normal 


(m; el) 
7 


verteilt. 

Beispiel 9.11.1. Eine Gruppe von Karteikarten entspreche den in einer Versicherungs- 
gesellschaft Versicherten. Die Versicherten teilen wir in zwei Kategorien ein: Zur ersten 
sollen diejenigen Versicherten gehören, die eine Familie zu erhalten haben, zur zweiten 
alleinstehende Personen. Die erste Gruppe sei auf der Karteikarte mit einer 1, die zweite 
mit einer O bezeichnet. Der Anteil der Versicherten, die zur ersten Kategorie gehören, be- 
trage p. Der Anteil der Versicherten, die zur zweiten Kategorie gehören, beträgt also 
g=1-p. 

Dieser Kartengruppe entnehmen wir eine.einfache Stichprobe vom Umfang n. Dabei 
werde vor dem Herausziehen einer jeden neuen Karte die schon gezogene Karte zurück- 
gelegt. 

Wir bezeichnen das Ergebnis der r-ten Ziehung mit x,; x, kann entweder den Wert 1 
oder den Wert 0 annehmen und ist der beobachtete Wert der Zufallsvariablen X,, die eine 
Null-Eins-Verteilung hat. Das arithmetische Mittel £ der Werte x, stellt den beobachteten 
Wert der Zufallsvariablen ö 


4Aı 


sin 


dar. Es sei nun » eine große Zahl, zum Beispiel n = 100, und es sei 9 = 0,3. Wie groß ist die 
Wahrscheinlichkeit dafür, daß wir einen Z-Wert erhalten, dessen Absolutwert sich von 
p = 0,30 höchstens um 0,02 unterscheidet? 

Wir benutzen den eben bewiesenen Satz, der aussagt, daß das Stichprobenmoment Ar 
asymptotisch normal 


N (m MER — =) 
) n 


verteilt ist, wenn das Moment m,, existiert. 
Für unser Beispiel ist 


m=m=p=03. 


Also ist die Stichprobenfunktion A, asymptotisch normal N (0,3; 0,0458) verteilt. Wir suchen 
die Wahrscheinlichkeit 


> 0,441. 


A—0,3 
P(|A, — 0,312 0,09) = p [( in 
0,0458 


Aus den Tafeln der Normalverteilung finden wir, daß diese Wahrscheinlichkeit gleich 0,66 ist. 
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9.12. Aufgaben und Ergänzungen 


1. a) Man zeige, daß die Dichtefunktion g(t) der durch (9.6.5) definierten Studentschen 5 
t-Verteilung die Beziehung 


li (t) I | 5) 
im g(t) = —— exp I — — 
nn Y2r 2 
erfüllt. 


b) Nach Gewinnung dieses Ergebnisses zeige man, daß auch die Beziehung (9.6.6) gilt. 

2. Man zeige, daß die Stichprobenfunktionen X und 82, d. h. der Mittelwert und die Varianz 
von einfachen aus einer Gesamtheit entnommenen Stichproben, in der das Merkmal X 
eine symmetrische Verteilung hat, nicht korreliert sind. 

3. Man leite die Formel (9.6.7) in der gleichen Weise her wie die Dichtefunktion der Student- 
schen i-Verteilung. 

4. Man leite die Formel für die Dichtefunktion der Zufallsvariablen Y=i? her, wobei i 
die durch (9.6.5) gegebene Verteilung hat, und vergleiche das Ergebnis mit (9.6.15) für 
r—=1. . 

5. In der Formel (9.6.14) für die Hotellingsche 7®-Verteilung setze man r=2 und n =4. 
Sodann bestimme man %-Werte derart, daß a) P(T?> y) = 0,05 und b) P(7?> y) 
= 0.01 ist, 

6. Man leite die Diehtefunktion der Snedecorschen Stichprobenfunktion F her. j 

7. Es seien X, (k=1,2,...,n,) und Y, (= 1,2, ...,n,) unabhängig, und es möge X; die 
Verteilung N (0; o,) und Y, die Verteilung N (0; 2) haben. Ferner sei 

1 N (ng. — 1) 8% 


Z=-ko H 
2 nen, — 1) 8 


Man zeige, daß die.Dichtefunktion R(z) der Zufallsvariablen Z die Form 


Zortı 5" [u v5? erız 


hie) = — 


fı re? nz Wı+rz)l2 
Bi, ae 
2 2 co] [ei 


mit y=m; —1(@=1,2) hat. 
8. Man bestimme die Verteilung der Stichprobenfunktion X einer einfachen n-gliedrigen 
Stichprobe aus einer Gesamtheit, in der X der Gammaverteilung genügt. 


9. Es sei X der Mittelwert einer einfachen n-gliedrigen Stichprobe aus einer Gesamtheit, 
in der das Merkmal X die durch (5.6.6) gegebene Gleichverteilung aufweist. Man zeige, 
daß die Dichtefunktion /(t) der Zufallsvariablen X die Form 


mn” H n k\r-1 i_ +1 
re) Ger) 


hat, wobei j=0,1,..,n —1 ist. 


10. Essei (X, X,...,X,),12 3, der Vektor einer Grundgesamtheit, und es habe die Matrix 
M der Momente weiter Ordnung A, (j,5=1,2,...,!) die Determinante |7 | =+0. Die 
(Kup sZp) (k=l,...,n) seien nnabhneige Beobachtungswerte des Vektors 
(X Xy ...‚ 7). Ferner sei Q die Matrix der Stichprobenmomente zweiter Ordnung, 


ga) = 
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11. 


12. 


13. 


d.h. die Matrix der Elemente W,,, die durch (9.6.12) und (9.6.13) definiert sind. Ri 
(,i=1,...,!) sei der Stichprobenkorrelationskoeffizient der Zufallsvariablen X; und 
X,, und es sei ( die Matrix mit den Elementen R,, und [C| die zugehörige Determinante 
(wobei R,;= 1 angenommen wird). 


Man zeige, daß der Vektor (R,,, Rys -.., Rı-ı,,) die durch die Formel 


1 I-1 
re] 
SE PER | omam92 


1 1 
ki—1)74 at ae Ba Zei 
le) r(5 (n >) rG; (n n) 


gegebene Dichtefunktion hat, wenn (X,X,...,X,) eine Normalverteilung mit 2,; 
=1lund},;=0(j=# 2) besitzt. 

(Fortsetzung.) Der partielle Stichprobenkorrelationskoeffizient von X, und X, bezüglich 
Xa ..., X; wird durch die Formel (vgl. Aufgabe 3.9.15) 


el _ Ol 


Ras... = m 


VlQiıl - I@a2l VlCui-lOgl 


definiert, wobei |Q,;] bzw. |C;;| die .algebraischen Komplemente des Ausdrucks W,; 
der Determinante |Q| bzw. des Ausdrucks R,;; der Determinante |C'| bedeutet. 


a) Man beweise: Hat (X,, 3 ..., X7) die Normalverteilung, so hat die Diehtefunktion 
rja.z...) der Zufallsvariablen R,,.,,‚ die Form (Fisuer [13]) 
n—lI 
Mrızs.) = — U oh Ran, DR 
7 
1 


ar 
x erg 
(1 Q13..1r123.) yi _. 
[1] 


'b) Man zeige: In dem Spezialfall, daß (X, X,, ..., X) eine Normalverteilung hat und 


Ya... 0 ist, gilt 


1 
1 1 


c) Man vergleiche diese Formeln mit (9.9.4) und (9.9.6). Wodurch ist » in den Formeln 
(9.9.4) und (9.9.6) zu ersetzen, um die hier angegebenen Formeln zu erhalten? 


raa..) = dor, DR. 


(Fortsetzung.) Man zeige, daß die Zufallsvariable 


Rı2a...ı jet 
1 — Riga... 
für O19.3,., — 0 die Studentsche t-Verteilung mit n — I Freiheitsgraden hat. 


(Fortsetzung.) Der mehrfache Korrelationskoeffizient (siehe Aufgabe 3.9.17) der Zufalls- 
variablen X, bezüglich der Zufallsvariablen X,, X, ..., X; wird durch die Formel 


/ 1@1 Y 10] 
R = I/1- — = I|/i— 
Be j Wlan! [Oyl 


28 Fisz 
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14. 


15. 


16. 


17. 


18. 


19. 


20. 


21. 


definiert. Man beweise: Hat (X,, X,,...,X;) eine Normalverteilung und ist 9; = 0 
1 

Gi=l,...,bj=#i), so hat Ri...) die Betaverteilung mit den Parametern © d—1), 

1 

z (n — I) (Fısaer [14]; die Verteilung von R},,,, ohne die Voraussetzung 0, = 0 hat 


Fister [15] angegeben). 

(Fortsetzung.) Man zeige, daß nR},. , für n > oo eine y?-Verteilung mit 7 — 1 Frei- 
heitsgraden hat und somit nicht asymptotisch normal verteilt ist. 

In den nachfolgenden Aufgaben 15 bis 21 verwenden wir die Bezeichnungen von 9.11 
und setzen voraus, daß sämtliche Momente der Grundgesamtheit existieren, die in diesen 
Aufgaben auftreten. Die Bedeutung des Symbols O( ) ist in Aufgabe 8.13.31 erklärt. 


Man zeige, daß die'folgenden Gleichungen gelten: 
u : 3u ku — 3u2 
BlA-m1=, Bla mt 
Man zeige, daß für j=1,2,... und n >00 
z 1 . 1 
E[(A, = m,)°1] =0 (J) ’ E[(A, = M)7] =0 (2) 
a i n 
ist. ä . j 
a) Man beweise: x ; i 
+3 2 —5 —3 
za, = 4 AIR _ de SM. 
R 67} m 


b) Unter Verwendung dieser Formel und der Beziehung (13.3.4) leite man eine Formel 
für .D2(B,) her. 

c) Für den Fall, daß das Merkmal X in einer Grundgesamtheit die Normalverteilung 
N (m; c) hat, zeige man, indem man darüber hinaus die Formel (5.7.7) hinzuzieht, daß 

2(n — 1) 
n? 


D?(B,) = 
gilt. 


or 


Man beweise: 
n—1i n—i1 
E & — m,) (2. ») = ZB 
n n 
Man beweise: 


: | 
E(B,) =n+0[5), D2(B,) = 


Pas — Bhpy-atun — Ak + Rush, (5). 
n m 


Man zeige, daß das zentrale Moment der Ordnung k einer einfachen Stichprobe für n — oo 
die asymptotische Normalverteilung 


N (m Y Hoy — 2hpıy-alyrı — Me + Anei) 


n 
hat. 


Man bestimme die Grenzverteilung für n —oo des Zufallsvektors 


[Yr(4ı — m), Yr (4, — m,)). 


Hinweis. Man verwende den Satz 6.13.2. 


10: DIE VERTEILUNG DER POSITIONSSTICHPROBEN- 
FUNKTIONEN 


10.1. _ Einleitende Bemerkungen 


Im vorigen Kapitel beschäftigten wir uns mit der Verteilung der Stichproben- 
momente und mit einigen ihrer Funktionen. Ein Stichprobenmoment ist das 
Gegenstück zum entsprechenden Moment der Gesamtheit. In diesem Kapitel 
wollen wir uns mit der Verteilung von Stichprobenfunktionen befassen, die wir 
Positionsstichprobenfunktionen nennen wollen; diese entsprechen den Lagepara- 
metern der Gesamtheit. Wir führen hier den Begriff der Stichprobenmediane und 
allgemeiner den eines Stichprobenquantils ein. Die Stiehprobenquantile und ihre 
Funktionen sind ‚Positionsstichprobenfunktionen. Die Theorie der Verteilungen 
dieser Stichprobenfunktionen und besonders die Theorie ihrer Grenzverteilungen 
spielt eine immer größere Rolle in der Wahrscheinlichkeitsrechnung und der 
mathematischen Statistik. 

Die genauen Beziehungen, die zwischen einer Stichprobe und der Grundgesamt- 
heit bestehen, werden vom Satz von GLIwEnko (vgl. 10.10) und den Sätzen von 
KoOLMOGOROFF und SMmIRNow (vgl. 10.11) erfaßt. Diese Sätze gehören zu den grund- 
legenden Ergebnissen der Theorie der Verteilungen von Positionsstichproben- 
funktionen. 


10.2. Die Positionsstichprobenfunktionen 


In Kapitel 3 beschäftigten wir uns mit den Lageparametern. Lageparameter sind 
insbesondere die Mediane, die Quantile und das kleinste Element der Stichprobe. 
In Stichproben von bestimmtem Umfang r wollen wir Zufallsvariable betrachten, 
die ein Gegenstück zu den Lageparametern bilden. Diese Zufallsvariablen' wollen 
wir Positionsstichprobenfunktionen oder kürzer Positionsfunktionen nennen. 

Diesen Begriff wollen wir nun genau formulieren. Es sei (X, Ku ..., 5) ein 
Zufallsvektor. 

Wir definieren die Zufallsvariable £®, die eine Funktion des Zufallsvektors 
X=(X,.-.,X,) sein soll, auf folgende Weise: Jedes Wertetupel (2, &a, -..; %n) 
dieses Zufallsvektors ordnen wir der Größe nach an und erhalten so eine Folge 
%y %p +++, %,, ie die Ungleichungen 

%, 2,2750, 
erfüllt. Sind zwei Keinen % und %; gleich, so ist ihre Reihenfolge gleich- 
gültig. 


28* 


436 10. Die Verteilung der Positionsstichprobenfunktionen 


Definition 10.2.1. Als Positionsfunktion a bezeichnen wir die Zufallsvariable, 
die für jede der möglichen Wertegruppen (&,, &,, ..., %,) des Vektors (X, ..., X») 
den k-ten Wert x,, des entsprechenden, der Größe nach geordneten n-Tupels 
(&,> % +, %,,) annimmt. Die Zahl k wird der Rang von £{® genannt. 

Für gegebenes n können wir n derartige Positionsfunktionen bilden, nämlich 
die Stichprobenfunktionen 


IRRE 


Beispiel 10.2.1. Jede der diskreten Zufallsvariablen X,, X,, X, möge die Werte 0, 1, 2 
annehmen können. Die Zufallsvariable (X,, X,, X,) kann dann die folgenden Wertetupel an- 
nehmen: ö 


(0, 0,0), (0, 0,1), (0,1,0), (1,0,0), (0, 0,2), (0,2, 0), (2,0,0), (1,1,0), (1,0,1), 
(0,1,1), (0,1,2), (0,2,1), (2,0,1), (2,1,0), (1,0,.2), (1,2,0), (0,2,2), (2,0, 2), 
(2,2,0), (1,1,1), (1,1,2), (1,2,1), (3,1,1), (1,2,2), (2,1,2), (2,2,1), (2,2, 2). 


Hier können wir drei Positionsfunktionen 
La, iD, [a 


bilden. Die erste nimmt in jedem dieser Tupel den kleinsten Wert an. Entsprechend ver- 
halten sich die beiden übrigen Positionsfunktionen. 


Definition 10.2.2. Das Verhältnis ı bezeichnen wir als den relativen Rang 
der Positionsfunktionen &®. “ 

Um die Grenzverteilung der Positionsfunktionen für n — oo zu untersuchen, 
betrachten wir die Folgen {2/”). Dabei kann % eine Funktion der Veränderlichen 
n sein. 

Wir unterscheiden zwei Typen von Positionsfunktionenfolgen. 


Definition 10.2.3. Ist lim ® =0 oder lim 4 = 1, so bezeichnen wir die 
no NR no R% 


Folge {£} als äußere Positionsfunktionenfolge. Ist dagegen lim % = mit 


no N 
0<A<1, so bezeichnen wir die Folge {£/”} als zentrale Positionsfunktionenfolge. 
Äußere Positionsfunktionenfolgen erhalten wir, falls wir für k irgendeinen 
festen Wert, zum Beispiel 1, 2,... oder eine Zahl von der Form n — I, wobei I 


konstant ist, nehmen. Für n — oo haben wir im ersten Fall - —0 und im 
1 N 
zweiten — —1. 
N 
Beispiel 10.2.2. Einer Grundgesamtheit entnehmen wir eine Stichprobenserie mit wachsen- 
dem Umfang r. In jeder dieser Proben beobachten wir den kleinsten Wert des Merkmals X 


oder, anders ausgedrückt, den Wert der Zufallsvariablen 2". Diese Werte bilden eine äußere 
Positionsfunktionenfolge. 
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Äußere Positionsfunktionenfolgen erhält man nicht nur für konstante k oder 
durch Subtraktion einer konstanten Zahl! von z, sondern zum Beispiel auch dann, 
wenn k (das im allgemeinen von n abhängig ist) langsamer als » gegen Unendlich 


—1. 


wächst. In diesem Fall gilt nämlich 2 0 oder 7— 
n n 


Beispiel 10.2.3. Einer Grundgesamtheit entnehmen wir eine Stichprobenserie mit wachsen- 
dem Umfang n. In jeder Stichprobe beobachten wir den Wert der Zufallsvariablen &$? mit 
k= [yr Rn]. !) Für Stichproben vom Umfang 


n = 2,3,4,5,6,7,8,9, 10, 11, 12, 13, 14, 15, 16, 17, ... 
haben wir also 
k=1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,... 


Die so bestimmte Positionsfunktionenfolge {£1®} gehört ebenfallszu den äußeren, denn es ist 


k n n 1 
ri le re ei; 
n>oo % Nn—X N no NR NO Yr 
Wir wählen nun k = = — 1, d.h., für ungerade » wählen wir das mittlere 


Element (der Größe nach gezählt), während wir für gerade n = 21 das (l + 1)-te 
Element nehmen. Diese Positionsfunktion £% nennen wir die Stichprobenmediane. 

Wenn k=f[nA] +1 gilt, wobei A eine beliebige reelle Zahl ist, O<A<1, 
so nennen wir die Positionsfunktion &” ein Stichprobenguantil. Offenbar strebt 
7 für n — oo gegen /. Daher stellt die Folge der Stichprobenquantile eine zen- 
trale Positionsfunktionenfolge dar. 

Ist % konstant oder gilt k=n — I +1, wobei ! konstant ist, so nennen wir 
Ci «sukzessives Element. 

Funktionen der Positionsfunktionen &{® werden wir gleichfalls als Positions- 
stichprobenfunktionen oder kürzer als Posstionsfunktionen bezeichnen. 


10.3. Die empirische Verteilungsfunktion 


A. Es sei (X,, Er ..., X.) ein Zufallsvektor, und es mögen (£j”, 69°, ...,&) 
sowie (%, , 2, +..,%,,) die gleiche Bedeutung "haben wie in 10.2. 


Definition 10.3.1. Die Funktion der Variablen x (= © < x < o), die gleich 


0 für 2<x, und gleich (m=1,2,3,...,n) für > x, ist, wobei m den 
m 


!) Unter [A] verstehen wir die größte ganze Zahl, die nicht größer als A ist. 
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größten Index bedeutet, für den die Ungleichung 
%,<# (10.3.1) 


erfüllt ist, heißt empirische Verteilungsfunktion. 

Der allgemeinen Gepflogenheit zufolge werden wir die empirische Verteilungs- 
funktion mit S,(x) bezeichnen. 

Somit ist nS,(x) die Anzahl der Stichprobenelemente, die kleiner sind als x. 
Die Funktion 8, (x) kann also Werte zwischen 0 und 1 annehmen und ist offenbar 
eine nicht abnehmende Funktion von x. Desgleichen verifiziert man leicht, daß 
8„(x) eine linksseitig stetige Funktion von & ist. 8, (x) hat als Funktion von & die 
Eigenschaften einer Verteilungsfunktion, und wir bezeichnen sie daher als empi- 
rische Verteilungsfunktion. Wir weisen jedoch darauf hin, daß S,(x) für jeden 
Wert von x eine Zufallsvariable ist. 


B. Nun mögen die Zufallsvariablen X,(r =1,2,...,n) unabhängig sein und die 
gleiche stetige Verteilungsfunktion F (x) haben. 
Die %,,,%,,, ...,%,, mögen ein der Größe nach geordnetes System von Beob- 
achtungswerten der Zufallsvariablen X,, X,, ..., X, bedeuten. Aus der Annahme, 
daß die Verteilungsfunktion F(x) stetig ist und die Variablen X, X, ..., X, 
unabhängig sind, geht hervor, daß die Wahrscheinlichkeit für das Auftreten 
zweier einander gleicher Werte X,, und X, , gleich 0 ist. Wir können daher an- 
nehmen, daß &,, <2%,, <+<x,, gilt. Nunmehr können wir die empirische Ver- 
teilungsfunktion 8,(x) in der folgenden Form darstellen: 

fü für z=<e 


Tı? 
k i 

S,(&) = z für 2, <<, (k=1,2,..,n—1), (10.3.2) 
ti für 2>a,. 


€. Nun seien die X,,X,, ..., X, unabhängig und mögen die gleiche Verteilungs- 
funktion F(x) haben. Aus den üblichen Voraussetzungen folgt, daß für jedes 
feste x die Beziehung 


P(X,<2)=F() =p = const (r=1,2,...,R) (10.3.3) 


- gilt. Somit ist $, (x) für einen festen Wert von x die Häufigkeit in einem Bernoulli- 
schen Versuchsschema und demnach die Realisierungshäufigkeit eines zufälligen 
Ereignisses in n unabhängigen Versuchen, wobei die Wahrscheinlichkeit für die 
Realisierung eines Ereignisses für jeden einzelnen Versuch gleich p = F (x) ist. 
Hieraus erhalten wir (siehe 5.2) für m = 0,1, ...,n 


P (s. (x) = ) = in er (Far (1 - Fa. (10.3.4) 
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Die Verteilungsfunktion der in 10.2 definierten Zufallsvariablen £{” bezeichnen 
wir mit ®,,(x). Wir haben 


Dun) = Pi <a). (10.3.5) 


Wir wollen diese Verteilungsfunktion ®,, (x) durch 8, (x) ausdrücken. Das Ereignis 
{m < x besteht darin, daß in einer Gruppe von n Beobachtungen die (hinsicht- 
lich der Größe) k-te Beobachtung kleiner als x ist, folglich also wenigstens k 
Beobachtungen kleiner als x sind. Dies ist gleichwertig damit, daß die beobachtete 


Häufigkeit Sn (x) nicht kleiner als # ist. So erhalten wir 
n 


Dun(&) = P(i® <a) = e(s (2) > .)- -2 ‚PS (x) = *): (10.3.6) 


Aus den Gleichungen (10.3.4) und (10.3.6) ergibt sich 


n ! 
Oulx) = Pe en (F@(1- Fa”. (10.3.7) 


Diese Verteilungsfunktion kann man auch in der Form 


) a a 1— te di 10.3.8 
ur er reee] (1-1) (10.3.8) 


schreiben. 

Die Richtigkeit der Formel (10.3.8) ergibt sich durch Integration [man inte- 
griert mehrere Male partiell, wodurch man (10.3.7) erhält]. Die Einzelheiten dieses 
Beweises wollen wir übergehen. 

Wir setzen nun voraus, daß die Dichte f(&) = F’(x) der Zufallsvariablen X 
existiert. Dann existiert auch die Dichte f(x) der Zufallsvariablen cd, Wir 
differenzieren die Formel (10.3.8) nach x und erhalten 


t 
fin (x) = WERT (F te (1 - Fee. (10.3.9) 


D. Die Verteilungsfunktion F'(x) sei stetig. Wir leiten nun eine Beziehung zwischen 
den Verteilungsfunktionen ®,_r41,n(®) und ®,„(#) oder zwischen den Verteilungen 
der Stichprobenfunktion 29 „,, und der Stichprobenfunktion £j” her. Wir schreiben 


F(a)=P(-X<a)=P(X>—a) =1— F(—:) 
_ und betrachten die unabhängigen Zufallsvariablen 


ER EN ON 
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die alle dieselbe Verteilungsfunktion F(@)=1— F(—x) haben. Mit &® sei 


die Positionsfunktion der Zufallsvariablen —X,, —X3 ..., —X,„ bezeichnet. Sie 
wird auf dieselbe Weise wie die Positionsfunktion 2m der Zufalisvariablen 
X,X,..., X, definiert. Ihre Verteilungsfunktion bezeichnen wir mit B,, (x). 
Aus (10.3.8) erhalten wir 
a r 10.3.10) 
„\T) = Fl — ek de. 67 
engen 
Daraus folgt 
ö a ei | 103.11 
x) = k-1(j — tyn-kdt. 5 .d. 
kn (—%) E-DIm m il (1 — t)rkd ( ) 
Aus (10.3.8) ergibt sich 
n! F@) 


Da-rıın(®) = nk (1 — El di. (10.3.12) 


Rne-n,” 
Im Integral (10.3.12) substituieren wir y = it und erhalten 
n! 1-F(x) 


: BER "hy k-1 
Bene) = em / (1 - yryeady 


1 
= ZEN. k-1 (1 — qyyn-k 10.3.1 
(n — k) aan, !ı ER ae nz nn 


"Wenn wir (10.3.11) und (10.3.13) miteinander vergleichen, erhalten wir 
| Da-rtı,n (2) = 1 — Din (— 8). (10.3.14) 


Beispiel 10.3.1. Wir nehmen an, es sei 


-® 


Ha) = 
m 
In einfachen Stichproben zu je zwei Elementen, die dieser normalen N(0;1) Gesamtheit 
entnommen wurden, ordnen wir die beobachteten Werte der Größe nach an. In jeder Stich- 
probe kommen hier zwei Werte, x, und &,, vor; es sei x; < 2,. Wir betrachten die Verteilung 
der Positionsfunktion &?. 
Die Zufallsvariable &® nimmt nun für jede Stichprobe den kleineren Wert x, an. Der 
Formel (10.3.9) entnehmen wir die Dichte der Zufallsvariablen £: 


Be: i oo 2 e 
PEN 2 
Fi (&) = vn (u e a). 


Die Dichte der Zufallsvariablen £{2) ist durch folgende Formel gegeben: 
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Beispiel 10.3.2. Einer im Intervall [0, 1]-gleichverteilten Gesamtheit, deren Dichte fi) 
durch 


1 für O0se<s1W, 
I@) = $ . 
0 für <<O undfür z>1 


gegeben ist, wollen wir einfache Stichproben zu je n Elementen entnehmen und die Ver- 
teilung der Positionsfunktion £® bestimmen. 
Ihre Dichte /,„ (x) wird nach (10.3.9) durch 


{ n! Ea Bi / 1 n-E 
Guss je) le) 


| ut ee here, 


(0 j für <sS0 undfür z>1. 


dargestellt. Wenn wir diesen Ausdruck mit (5.9.3) vergleichen, so sehen wir, daß in diesem 
Beispiel die Z}"° eine Betaverteilungmit p=k und g=n— k+1 hat. 
So seizum Beispiel n=5 und k=1; dann hat £{? eine Betaverteilung mit p=1 und 
q = 5. Wir berechnen die Wahrscheinlichkeit dafür, daß der Wert der Zufallsvariablen Z1? 
zwischen 0,1 und 0,2 variiert. Es gilt 
02 
POIs <02)=5 J d- tda=[- (1-2) = —0,85 4 0,9 = 0,26281: 
0,1 
In unserem Beispiel war die unmittelbare Berechnung der gesuchten Wahrscheinlichkeit 
sehr einfach. Im allgemeinen kann man zur Berechnung von Wahrscheinlichkeiten einer 
Betaverteilung die Pearsonschen Tafeln (vgl. PEarsonx [4]) benutzen. 


10.4. Die stochastische Konvergenz einer Folge von Stichprobenquantilen 


Von nun an wollen wir uns bei der Betrachtung von zentralen Positionsfunktionen- 
folgen {£’} auf Folgen von Stichprobenquantilen beschränken, also auf den Fall 
k={[n4] +1. Bei der Untersuchung von äußeren Positionsfunktionenfolgen 
{&7°} wollen wir uns auf Folgen von Randelementen beschränken, also auf den 
Fall, daß %k konstant oder aber gleich n — + 1 ist, wobei I konstant ist. 

Die Zufallsvariablen X,, X, ..., X, seien voneinander unabhängig und mögen 
dieselbe stetige Verteilungsfunktion F(x) haben. Wir betrachten die Folge {7} 
von Stichprobenquantilen; also ist 


k=[nA] +1, 


wobei 0 <A <<{1. Für jeden Wert A aus dem Intervall O<?}<1 gibt es minde- 
stens einen Wert a, derart, daß 


1-P(X=a)<F(a)<A (10.4.1) 


ist. Wie man weiß, ist der Wert a, ein Lageparameter, nämlich das Verteilungs- 
quantil jeder einzelnen der Zufallsvariablen X. 


442 10. Die Verteilung der Positionsstichprobenfunktionen 


Jetzt wollen wir nachweisen, daß — falls (10.4.1) nur eine einzige Lösung «a; 
besitzt — die Folge {&/”} der Stichprobenquantile stochastisch gegen das ent- 
sprechende Gesamtheitsquantil, also gegen a,, konvergiert. Speziell konvergiert 
daher die Folge der Stichprobenmedianen (siehe 10.2) stochastisch gegen die 
Mediane der Gesamtheit. 


Satz 10.4.1. Es bedeute F(x) die Verteilungsfunktion der Zufallsvariablen X, 
ferner &” das Quantil aus einfachen Stichproben (k= [nA] +1, 0<A<I1). 
Existiertnur ein Punkt x = a,, der der Ungleichung (10.4.1) genügt, so konvergiert 


die Folge der Positionsfunktionen £{” stochastisch gegen den Lageparameter a;. 


Beweis. Im Sinne der Definition der stochastischen Konvergenz (vgl. 6.2) 
müssen wir beweisen, daß für ein beliebiges e > 0 


im P(® —|2.=0 (10.4.2) 


ist. Die Beziehung ist den zwei folgenden Beziehungen gleichwertig: 


imPi®>2a,+e.=0, 


Nn>X 


im PP <a, —.d)=0. 


Nn>09 


Aus der Definition 10.3.1 folgt, daß diese zwei Beziehungen den folgenden Be- 
ziehungen äquivalent sind: 


lim e(s. (.+2)< .) =0, (10.4.3) 
X e NR 

. k e 1 ’ 
lim e(s. (a, —e)> —0. (10.4.3°) 
n->00 N 


Wir beachten jedoch, daß aus der Annahme, das der Beziehung (10.4.1) genügende 
a, sei eindeutig bestimmt, für hinreichend kleine e > 0 die Beziehungen 


lim (r Bee .) = Fa, +)—-i=&,>0, (10.4.4) 
N N 

. k re 1 ’ 
lim (m Ze - Fi, -)-i=,<0 (10.4.4') 
N—XO RN 


folgen. Wir zeigen nun, daß sich aus (10.4.4) die Beziehung (10.4.3) ergibt. In der 
Tat folgt aus (10.4.4) für hinreichend große n 


& 


k 
u P 
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Daraus folgt 


P(s10 +9 <3)<P (a +0 -Fant+9<-3) 


=P (15.0 +2) - F(a, +e)|> ”) .. (10.4.5) 


Da, wie wir aus 10.3 wissen, die Zufallsvariable $,(x) für feste «-Werte die 
Häufigkeit in einem Bernoullischen Versuchsschema mit der Erfolgswahrschein- 
lichkeit 9 = F(x) ist, gilt im Punkt = a, +e 

ES, +9))=P=F@aı-+e, (10.4.6) 


er Le Fa+ gl - Fa +e)) 
n NR ; 


D?(S,(a, + €) (10.4.7) 
Aus der Tschebyscheffschen Ungleichung (3.3.4) und aus (10.4.5) erhalten wir 


Im P (5,00 NN .) in art Fee) Zn u 0. 


2 
n no nö, n>o NO] 


Damit haben wir die Gleichung (10.4.3) bewiesen. 
Ganz analog kann man nachweisen, daß aus (10.4.4’) die Gleichung (10.4.3’) 
folgt. Der Satz 10.4.1 ist damit bewiesen. 


10.5. Die Grenzverteilungen der Stiehprobenquantile 
Es sei {{P ein Stichprobenquantil, also k= [nA] +1 mit O0<A<1. Daher 


haben wir hier — —4 für n — oo. Ferner ist 
n 


lim ( = ) Yn =0. 2 | (10.5.1) 


n>o \N 


Denn es ist nA<k=[nA] F+1L<sAn-+1 und folglich 


0< (-)m=. 
” Yn 
Aus dieser Ungleichung erhalten wir (10.5.1). 

Wir wollen nun annehmen, daß die Zufallsvariablen X,, X, ..., X, unabhängig 
und stetig sind und alle dieselbe Verteilungsfunktion F(x) haben. Die bloße 
Feststellung, daß die Folgen von Stichprobenquantilen stochastisch gegen die ent- 
sprechenden Lageparameter der Gesamtheit konvergieren, ist für die Anwendun- 
gen unzureichend. Sie erlaubt uns nämlich nicht, die Wahrscheinlichkeit dafür 
festzustellen, daß sich die Stichprobenquantile um eine bestimmte Größe von den 

‘entsprechenden Lageparametern unterscheiden. 
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Satz 10.5.1. Es seien P(&), fix) und (0 <A<1) die Verteilungsfunktion, 
die Dichte bzw. das Quantil der Zufallsvariablen X, ferner sei &{” das Quantil aus 
einfachen Stichproben (k = [n}] + 1), und 9, (y) sei die Dichte der Zufallsvariablen 


pn % _ tt _ a) — a), (10.5.2) 
21-2) 


Ist im Punkt x = a, die Dichte f(x) stetig und mositiv, so gilt für jedes reelle Zahlen- 
paar y,Yysmil Yı < Ya die Beziehung 


Yz u” 
lim P(y, <Y® <y,) =lim [gm(y) dy = 2 dy. (10.5.3) 


1 Ye _ 
—— [e 
n—>00 n—00 yı V 2x J 
Beweis, Die Dichte f,, (x) der Zufallsvariablen £{” hat nach (10.3.9) die Gestalt 


! 
Tin (x) = Benin (Fa) (1 — Fa) *f(@). 


Nach (2.4.10) erhalten wir die Dichte g,,(y) in der Form 


u ml ER) 


fa,) n fa) 
n Ada ! 2 " 
u el = Fer 
e [a n! . Bd Lay al 
] n k-V)!m-k+i)! [a 
f(@) zen” ( — ey Be 
fa)\ A Bea es 
mit 
2-4 N 
N f(a,) 
Wir setzen . 
Pe en n! ya — apa nit 
n (k-Ii!n—k+i)! 1.1 


FR & (e "F Y N /(a,) el Fa 1 — Fiay\rm# 
- f{a,) j : 1-4 5 


rn 
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Dann gilt die Gleichung 
Ien(y) = Aıln) Az(n) A;(n). (10.5.5) 
Wir betrachten der Reihe nach die Faktoren A, (n), A,(n), Az(n). 
Aus der Stirlingschen Formel m! = () VY2rm erhalten wir 
e 
n! N” Y2rn 


Bm —k+N Y2r(k — 1) Veran —k+1) (k—1- Um — + 1jetrr 


Setzen wir näherungsweise k— 1wnA undn—k+lwun— nA, so folgt 


n! a 1 n" 
(kN! m—-k+U! YVarall — Am (nAyln — man 
1 1 m" 
Yarılı _ An Ama] — Ayu-na mA gn-na 
1 1 


 VaRad = m ara Zap 


Nach Substitution dieses Ausdrucks in die Formel für A, (n) erhalten wir 


Wegen Se Ani. —1-—4 ergibt sich 
n 
e 1 
lim A,(r) = —. (10.5.6) 


Aus der Voraussetzung der Stetigkeit der Funktion f(x) im Punkt x = a; folgt die 
Gleichung 


lim A,(n) =1. (10.5.7) 


NIX 


Wir befassen uns nun mit dem Faktor A,(n). Die Funktion F(x) können 
wir in der Umgebung des Punktes x = a, folgendermaßen entwickeln: 


F(&) = F(a;) + F’ (a) (8 — a) + 0(® — a) 


+ 


N fa.) 
-i+y [en (1-0, 9), (10.5.8) 


wobei die Funktion Q(n, y) für n —oo gegen Null strebt. 
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Setzen wir den Ausdruck (10.5.8) in die Formel für A, (n) ein, dann erhalten wir 


ar _ 91 8-1 I1—-a In-—-i 
yYe—rurens)| | VE roms) | 


is 7 ni I 1-27 


Wir schreiben 


1-4 en 
eV +Qn, y)), = Vu How) 
und erhalten 


DEI En ER | 10.5.9 
(n) = -(1+72) ( vn) (10.5.9) 


Daraus folgt 
b 
log A,(n) = (k — 1) log ( En ) + (n — k)log ( = m): 
N n 


Da für n—o0 die Werte LE und 2 gegen Null streben, kann man für hin- 
n N 


reichend große n den letzten Ausdruck folgendermaßen entwickeln: 
1 
log As(n) = (k — 1) Ar y— pro : 


Hn-nl- urn +()) 


_k-Na-m-hb, K-Daım-hag, „„(t\. 
Ym ; ae 

10.5.10 

Wir haben | 


k-NDa-n-h)b_ 9 wi; 9) 


m 1+0(n, 9) 


Ban 1+0(n, y) 


ur =) 1 = 
a Yr / Yyaa-a 
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Falls wir (10.5.1) berücksichtigen, erhalten wir 
(k —1)a—(n— k)b 


lim =0. (10.5.11) 
NND Yn 
Ferner haben wir 
Er 2 ne 
lim (k — 1)a® + (n — k)b2 
n>0 N 
ki-—i k ji 
= lim | — ——- VE WERTEN Ey) ‚y)\2 
im |, z +( 7 Al +0, y)) 
1-4 r " 
a 1—- A) — =1. 10.5.12 
er (10.5.12) 


Unter Beachtung der Formeln (10.5.10) bis (10.5.12) und der Tatsache, daß 
no (.) —0 für n —oo strebt, ergibt sich 
n 


yR 
limlog A, (n)=— >; 
n>0 2 
_ 
lim A,(n) =e ?. (10.5.13) 
> . 
Aus den Formeln (10.5.6), (10.5.7) und (10.5.13) folgt sofort 

i -i 
lim = —e ?. -(10.5.14) 
„m Gem (y) Var ( 


Da die Funktionen A, (n), A,(n), A;(r) in jedem Intervall (y,, y,) gleichmäßig 
beschränkt sind, erhalten wir schließlich aus (10.5.14) 


lim P(y, < Y® <y,) =lim 1 In (y) dy = R lim 94. (y) dy = — f 3 dy. 
N n>x Yı >70 27 Yı 
Der Satz 10.5.1 ist damit bewiesen. 

Aus Satz 10.5.1 folgt: Ist in der betrachteten Gesamtheit die Zufallsvariable X 
stetig mit der Dichte f(x) verteilt und ist die Funktion f(x) im Punkt x = a; 
stetig und positiv, wobei a, ein Quantil der Gesamtheit ist, dann ist das Quantil £{” 
aus einfachen Stichproben asymptotisch normal 


N (a: } a — UR) (10.5.15) 
f(a;) 


verteilt. 
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Beispiel 10.5.1. Aus einer Grundgesamtheit, deren Merkmal X normal N (0; 1) verteilt 
ist, erheben wir eine einfache Stichprobe vom Umfang r = 121. Die aus dieser Stichprobe 
errechnete Mediane sei —0,5. Wie groß ist die Wahrscheinlichkeit dafür, daß man aus einer 
Stichprobe vom gleichen Umfang eine kleinere Mediane als die beobachtete —0,5 erhält? 


1 
In diesem Beispiel ist A= —, und die Mediane der Gesamtheit ist der Punkt a1 der die 
Gleichung z 


1 “, en En 
ar e ?2d<=0,5 
Y2r 


1 
erfüllt, also 4, = 0. Weiter ist f(a;) = — 
2 2? 


Vor 


Die Stichprobenmediane £{12® ist asymptotisch normal 


v{o: 2r N (0; 0,114 
’92 121 a (0;0, ) 


verteilt. Deshalb ist 


Pam < 0,5) = P a 08 = 0(-4,39) 
a DRITT 77 


Aus den Tafeln der Normalverteilung lesen wir die gesuchte Wahrscheinlichkeit ab; sie 
ist äußerst klein, nämlich gleich 0,00001. 


Beispiel 10.5.2. Wir betrachten eine Gesamtheit, in der das Merkmal X mit der Dichte 


22 für 0OSe<sI, 
f@) = y : 
0 für <<O undfür z<>1 


verteilt ist. 


Den Viertelwert a, dieser Gesamtheit bestimmen wir aus der Gleichung 
1 


a, 


J2« dx = 0,25; 
[} 


es ist also a, = 0,5 und f{aı) =: 
€ E 


Aus dieser Gesamtheit erheben wir eine einfache Stichprobe vom Umfang » = 70 und 
bestimmen den Stichprobenviertelwert, d. h., wir beobachten den Wert der Positionsfunktion 
6, wobei n=70 und k=[0,25-70] +1=18 ist. Wie groß ist die Wahrscheinlichkeit 
dafür, einen Viertelwert nicht kleiner als 0,75 zu erhalten? 


Die Positionsfunktion (9 hat in Annäherung die Normalverteilun 
18 8 8 


0,25 - 0,75 
N (os: r) = N (0,5; 0,052). 
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Daraus erhalten wir 


0) _05_ 0,25 
218 > rs 1 — D(4,81) » 0,0000. 
0,052 0,052 


Pi > 0,75) = P | 


Der Satz 10.5.1 ist ein Teil der allgemeinen Theorie der Grenzwertsätze für 
zentrale Folgen won Positionsstichprobenfunktionen, die von N.W.Smırnow [3] für 
den Fall entwickelt wurde, daß die X,, X,, ..., X, die gleiche Verteilung haben, 
während sie von Lo&ve [5] und CosBUrRN [1] ohne Voraussetzung der gleichen 
Verteilung für die Variablen X, X, ..., X, hergeleitet wurde. Für eine Medianen- 
folge wurde der Satz 10.5.1 von Foczısox [1] bewiesen. 


10.6. Die Grenzverteilungen der Randelemente einer Stichprobe 


Am Ende von 10.2 definierten wir Zufallsvariable, die wir als Randelemente be- 


zeichneten. Dies sind äußere Positionsfunktionen &”, für die k entweder konstant 


oder k=n — !-+1 mit konstantem [ ist. Im ersten Fall ist lim & — 0, während 
n>oo N 

im zweiten Fall lim # —=1 ist. 

no N 


Wir wollen nün annehmen, daß die Zufallsvariablen X,, X,, ..., X, unabhängig 
und stetig mit derselben Dichte /(x) verteilt sind. ; 
Nach (10.3.9) ist die Dichte der Zufallsvariablen ee durch 
n! k-1[ k 
Ten (&) = k_DImm Fayli — Fo") 
gegeben. 
Die Zufallsvariable Z}” sei durch 


ZW — nF (c®) (10.6.1) 


definiert, sie nehme also nur Werte 2 aus dem Intervall [0, 2%] an. Ihre Dichte 
bezeichnen wir mit hy. (2). Es gilt 


= k-1 n—k 
han) = 2 (k— D!(n — k)!\2n ®n j 


(0 für 2<O und für 2>2n. 


(10.6.2) 


Wir schreiben (10.6.2) in der Form 


a t Er} 
Run (2) - Zu aa ( en 2) . 
3 


FA a (i en: 
2n, 


29 Fisz 
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Da k konstant ist, erhalten wir 


EB U Zu LER m ®ZE+D- nl) — lim (' ft =) =1, 
n 


no (N — k)int-1 „200 nk-1 PIRe 


n ER 
Wenn wir beachten, daß (k — 1)! = !'(k) und: lim ( _ 2) =e ? ist, er- 
halten wir schließlich 20 zn 
I gi-le 2 
E ü > 
im Au) =I arm u rt. (10.6.3) 
no 2 
0 für z2<O0. 


Da die Funktionen h;, (2) für alle rn in jedem endlichen Intervall a <z<b gleich- 
mäßig beschränkt sind, gilt 


b 
lim Pa <2° <b) lim [ hunle)dz 


n->%9 >06 
b er, 
= Y he him (2) de = f Iro da. (10.6.4) 


Die Zufallsvariable Z/” hat somit eine asymptotische y?-Verteilung mit m = 2k 
Freiheitsgraden. Ähnlich finden wir, daß die Zufallsvariable 


Up = 2n{l — F(ÜP)],; 


wobei k=n— +1 ist, eine asymptotische y?-Verteilung mit 2! Freiheitsgraden 
hat: 


w|s 


. (n) : ule ö iR: 
lim (<UmM<d= I) ar (10.6.5) 


Die Positionsfunktion £{” ist hier der !-te Stichprobenwert, vom größten Wert an 
gezählt, 

Für die Bestimmung der asymptotischen Verteilung der Positionsfunktion Z{” 
ist die Bedeutung der Formeln (10.6.4) und (10.6.5) nur gering, und zwar wegen 
der Schwierigkeiten, die bei der Bestimmung von £/” als Funktion von Z{® oder 
U” auftreten. Als Anwendung dieser Formeln bringen wir nur ein einfaches 
Beispiel. 
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Beispiel 10.6.1. Die Zufallsvariable X habe die durch folgende Formel bestimmte Gleich- 
verteilung: 
1 für 0<e<1, 
fe), = x 2 
0 für <<O undfür «>1. 


Wir bestimmen aus einfachen Stichproben die Positionsfunktion £® bei festem k sowie die 
durch (10.6.1) definierte Zufallsvariable Z{®. In unserem Beispiel ist 


ZU = 2ni®, 


Aus den vorherigen Betrachtungen folgt, daß die Zufallsvariable 2n{{” eine asymptotische 
x-Verteilung mit 21 Freiheitsgraden hat. Es sei zum Beispiel » = 100 und k=5. Wir suchen 
die Wahrscheinlichkeit dafür, daß & in) > 0,0915 ist. Es gilt 


P(e® > 0,0915) = P(200 29 > 18,3). 


Aus den Tafeln der y2-Verteilung lesen wir ab, daß bei 10 Freiheitsgraden die gesuchte Wahr- 
scheinlichkeit in Annäherung 0,05 beträgt. 


Die Grenzverteilung des größten Stichprobenelements unter Voräussetzung 
der gleichen Verteilung für die Zufallsvariablen X, X, ..., X„ untersuchten u. a. 
Fr£cuHer [1], von Miszs [2] und GwneDEnko [8]. In [8] hat GnEDENko die Klasse 
aller Grenzverteilungen (bei entsprechender Normierung) des größten Stichproben- 
elements angegeben. N. W. Smirwow [3] waridte die Methode von GNEDENKO 

bei der Untersuchung der Grenzverteilung eines beliebigen sukzessiven Stich- 
probenelements an. MeJzLer [1] untersuchte die Grenzverteilungen des größten 
Stichprobenelements ohne die Voraussetzung, daß die Variablen X,, X, ..., X, 
die gleiche Verteilung haben. Unter den gleichen Bedingungen entwickelten 
Lo&v& [5] und CoczuRn [1] eine allgemeine Theorie der Grenzverteilungen des 
sukzessiven Stichprobenelements sowie gemeinsame Grenzverteilungen von 
Gruppen sukzessiver Stichprobenelemente (siehe auch die Monographie von 
Gumskt [2]). 


10.7. Die gemeinsame Verteilung einer Gruppe von Quantilen 


Die stetigen Zufallsvariablen Xp Xg ..., X, seien voneinander unabhängig und 
. mögen alle dieselbe Verteilungsfunktion F(&) und die Dichte f(x) haben. Wir 
betrachten die Positionsstichprobenfunktionen 


A, 


Die Werte, die diese Positionsfunktionen annehmen können, bezeichnen wir ent- 
sprechend mit %,, %9 :.., Yn. Es soll die gemeinsame Verteilung der Zufallsvariablen 


ei) 
29* 


u. 
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mit 
ISh<h<<;<n wd 1<r<so 


bestimmt werden. Wir teilen die x-Achse in die Intervalle 


I, = (0, Yy;); I; = (Yo Y;.]; oo. Ir = (Y, +) 


ein. Die gesuchte gemeinsame Wahrscheinlichkeitsverteilung finden heißt, für 
beliebige (%,,, %,,, -.-, y,) die Wahrscheinlichkeit des Ereignisses A zu bestimmen, 
das darin besteht, daß sich j, —1 Werte von x im Intervall /, und ein Wert von 
x im „Intervall“ (y,,%, + dy,) befinden, weiter, daß sich j, — jı — 1 Werte 
von x im Intervall /, und einer im ‚‚Intervall“ 


(Y Y, 7 dy,) Er 


befinden usw. und endlich, daß sich » — j, Werte von & im Intervall I,.ı befinden. 
Wir bezeichnen mit », die Wahrscheinlichkeit dafür, daß X einen Wert aus J; 
annimmt: 


Di = [fe) dx (k=1,2,.,r+1). 
Ir 


Aus der Formel (2.3.8) folgt: Die Wahrscheinlichkeit dafür, daß X einen Wert aus 
dem „Intervall“ (y,,y; + dy,) annimmt, ist gleich f(y,)dy,. Das Wahr- 
scheinlichkeitselement der Zufallsvariablen 


{n) Fin) {n) 
a ee) 


erhalten wir also aus (5.12.1”): 


Pi) =n! CB RE aaa Te Inge 
El ji Y,, Ya Y;, 
AGD DU Ga da) e . 
= 9y. BETT, Y;,) dy;, Dr dy,. (10.7.1) 


Die Dichte der gemeinsamen Verteilung der Zufallsvariablen £, ..., £5” ist also 
im Bereich y, <---<y; gleich g(y,,....,4,), während sie für den übrigen Be- 
reich gleich 0 ist. 

Wir betrachten insbesondere die gemeinsame Verteilung der Zufallsvariablen 
(, a d.h. die gemeinsame Verteilung des größten und des kleinsten x-Wertes 
in einer einfachen Stichprobe vom Umfang n. Für diesen Fall it r=2,j, =1 
und j,=r. Aus (10.7.1) erhalten wir für die gesuchte Dichtefunktion 9 (Y,, 4.) 
die Formel 


(Yu) = (10.7.2) 


I0- für AS Ya- 
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10.8. Die Verteilung der Stichprobenbreite 


In Kapitel 3 führten wir den Begriff der Variationsbreite ein, die ein Parameter 
der Verteilung der Grundgesamtheit ist und neben der Dispersion als Streuungs- 
maß dient. 

Bei einer Stichprobe vom Umfang x, deren Elemente der Größe nach an- 
geordnet sind, versteht man unter der Stichprobenvariationsbreite oder Stichproben- 
breite die Differenz zwischen dem größten und dem kleinsten Stichprobenelement. 
Die Stichprobenbreite ist eine Zufallsvariable. 


Definition 10.8.1. Die Zufallsvariable W, die durch 
VW = a En ge 


bestimmt ist, nennen wir Stichprobenbreite; dabei habe die Stichprobe den 
Umfang n. 

Da nach Voraussetzung £{® > £{” ist, nimmt die Zufallsvariable W nur nicht- 
negative Werte an. 

Die Verteilung der Stichprobenbreite (aus einfachen Stichproben) kann man 
aus (10.7.2) erhalten. Sie sind aber im allgemeinen kompliziert. Hier bemerken 
wir nur, daß für Stichproben aus einer normalen Gesamtheit die mit der Ver- 
teilung der Stichprobenbreite zusammenhängenden Wahrscheinlichkeiten in den 
Tafeln von HArTLEY und PEARSoN [1] und die Ausdrücke für die Momente in 
der Arbeit von Tırrerr [1] zusammengestellt sind. 

Errving [1] untersuchte die asymptotische Verteilung (für ; % —0o) der Breite 
einer einfachen Stichprobe aus einer normalen Gesamtheit; GumBEL [1] untersuchte 
die asymptotische Verteilung einer einfachen Stichprobe aus einer Gesamtheit, 
in der das betrachtete Merkmal X eine unbeschränkte Zufallsvariable ist, Momente 
beliebiger Ordnung besitzt und darüber hinaus eine beliebige Verteilung aufweisen 
kann. 

Die Dichtefunktion h(w) der Breite W einer n-gliedrigen einfachen Stichprobe, 
die aus einer Gesamtheit herausgegriffen wurde, in der X im Intervall [0, 1] 
gleichverteilt ist, erhalten wir leicht aus den Formeln (6.5.7) und (10.7.2). In der 
Tat, (10.7.2). hat jetzt die Form 
nr - my? für O<Sy<ymst, 


0 im übrigen Bereich. 


| 


Setzen wir w=%„—y, und erinnern wir uns daran, daß 0<y, -w<si1 und 
damit O0<y, s1-— w gilt, so erhalten wir 


1—-w 
nn — 1) [way nm —1w2(i1—u) für 0o<w<i 
0 


kw) = " (10.8.2) 


0 für w<0,w>1. 
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10.9. Die Toleranzgrenzen 


Die Zufallsvariable X sei stetig mit der Dichte f(x) verteilt. Es seien £, ..., & 
Positionsstichprobenfunktionen, wobei die Stichproben vom Umfang n einfach 
sind und aus einer Gesamtheit stammen, deren Merkmal X wir untersuchen 
wollen. Wir betrachten das Integral 


Is . 
w= [| fia) de; (10.9.1) 


Lı 


dabei sind L,; = L,(&, ...,2®) 6 = 1,2) eindeutige Funktionen der Zufalls- 
variablen £®,..., £. Die Funktionen L, und L, sind Zufallsvariable, und daher 
ist auch das Integral W eine Zufallsvariable. Wir bemerken, daß W die Wahr- 
scheinlichkeit für die Relation L,SX=<L, ist. Diese Wahrscheinlichkeit ist 
wegen des zufälligen Charakters der Funktionen L, und L, eine Zufallsgröße. 
Mit anderen Worten: W ist der Anteil derjenigen Gesamtheitselemente, die zwi- 
schen den zufälligen Grenzen L, und Z, liegen. 


Definition 10.9.1. Die in (10.9.1) vorkommenden Funktionen L, und L, 
nennt man Toleranzgrenzen. Wenn die Verteilung der Zufallsvariablen W für alle 
Dichten f(x) dieselbe ist, so nennen wir L, und Z, verteilungsunabhängige Toleranz- 
grenzen. 

Wir betrachten den Spezialfall Z,=L{” und L,;,=£ und zeigen, daß Z, und 
L, verteilungsunabhängige Toleranzgrenzen sind. In der Tat, wir schreiben 
(10.9.1) in der Form 


W=F@)—- Fa. 


Aus der Voraussetzung, daß die Funktion F(x) stetig ist, folgt (siehe 5.6), daß 
Y= F(X) im Intervall [0, 1] gleichverteilt ist. Abgesehen von den Bereichen, in 
denen die Funktion F(x) konstant ist (dies hat keine Bedeutung), ist F(x) eine 
wachsende Funktion, und damit ist W die Breite einer einfachen Stichprobe, die 
aus einer Grundgesamtheit mit Gleichverteilung herausgegriffen wurde. Die Dichte- 
funktion k(w) .der Zufallsvariablen W ist daher durch (10.8.2) gegeben. Diese 
Dichtefunktion ist von F (x) unabhängig, und somit sind 2{® und £(” von der Ver- 
teilung unabhängige Toleranzgrenzen. Man kann also für eine beliebige Zufalls- 
variable X mit stetiger Verteilungsfunktion und für. ein beliebiges « > 0 ein n so 
wählen, daß 


1 
PWzw=nn—1) [w*1-udw>a 

w 
. gilt. Für ein geeignet gewähltes » haben wir daher eine Wahrscheinlichkeit 


>« dafür, daß die Anzahl der Elemente der Gesamtheit, die zwischen dem klein- 
sten und dem größten Element einer n-gliedrigen Stichprobe enthalten sind, 


10.9. Die Toleranzgrenzen 455 


zumindest den Wert w erreicht. Dieses Ergebnis wurde von Wırks [2] ge- 
wonnen. Wauo [1] verallgemeinerte dieses Ergebnis auf mehrdimensionale Zu- 
fallsvariable. 

Wir bemerken, daß W eine Betaverteilung (vgl. 5.9) mit py=n—1 und 
g—=2 hat. Aus (5.9.5) und (5.9.6) erhalten wir somit 


we De(W) = — RE (10.9.2) 
n+i1 


ee n+la+1)n +2) 


Hieraus erkennen wir, daß für relativ kleine » die Stichprobenfunktion W nahe 
bei 1 liest. 


Beispiel 10.9.1. Es sei & = 0,95 und w = 0,95. Dann haben wir 


| ; 
P(W>208)=n(n—1) [ w"(1 — w)dw> 0,95. 
0,95 


Hieraus erhalten wir n x 93. 


Ein anderes für die Anwendungen wichtiges Beispiel für Toleranzengrenzen 
ist das folgende: 


Beispiel 10.9.2. Es seien X und 8? der Mittelwert bzw. die Varianz einer n-gliedrigen ein- 
fachen Stichprobe aus einer normalen Gesamtheit N (m; o), wobei m und o unbekannt sind. 
Wir setzen 


(10.9.3) 


Die Integrationsgrenzen X — h8’ und X +58” sind Zufallsvariable, und das gleiche gilt 
somit für W, die Anzahl der Elemente der Grundgesamtheit im Intervall (X — RS’, X + hS’). 
Die Endpunkte dieses Intervalls sind die Toleranzgrenzen. Sie sind hier jedoch von der 
Verteilung nicht unabhängig. Warn und Worrowızz [3] haben ein Verfahren zur angenäherten 
“ Berechnung der Wahrscheinlichkeit 


PWzu)=a 


als einer Funktion von w, h und n angegeben, wobei W durch (10.9.3) gegeben ist. Tabellen, 
die mit der Berechnung dieser Wahrscheinlichkeiten zusammenhängen, wurden von BOwKER 
[1] bearbeitet. 

Es muß abschließend noch betont werden, daß W für ein festes h eine Zufallsvariable 
ist; es ist daher nicht gerechtfertigt, W aus den Tafeln für die Normalverteilung zu berechnen, 
wie das häufig in der Praxis geschieht, wobei man W= P(—h=zY<h) setzt und Y die 
Normalverteilung N (0; 1) hat. 
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10.10. Der Satz von Gliwenko 


A. In i0.3.A definierten wir für jeden Wert x die empirische Verteilungsfunktion 
S,(x). Entnehmen wir einer Grundgesamtheit eine Stichprobe vom Umfang n, so 
ist die Anzahl der beobachteten Stichprobenwerte, die kleiner als x sind, gleich 
nS„(x). Die Zufallsvariable S,(z) kann also nur Werte aus dem Intervall [0, 1] 
annehmen. Wir stellten fest, daß die Funktion $,(x) nicht abnehmend und links- 
seitig stetig ist. Daraus folgt, daß S, (x) als Funktion von x dieselbenEigenschaften 
wie eine Verteilungsfunktion hat. Wir nannten sie deshalb eine emprirische Ver- 
teilungsfunktion (im Gegensatz zur Verteilungsfunktion F(x) der Gesamtheit, die 
man auch die theoretische Verteilungsfunktion nennt). Wie wir schon erwähnten, 
ist in einfachen Stichproben für festes x die Zahl 8,(x) die Häufigkeit in einem 
Bernoullischen Versuchsschema, also die Realisierungshäufigkeit eines zufälligen 
Ereignisses in n unabhängigen Versuchen, wobei die Realisierungswahrscheinlich- 
keit dieses Ereignisses in einem einzelnen Versuch gleich 9 = F(x) ist. 

Äußerst wichtig ist die Frage nach den Beziehungen, die zwischen den empiri- 
schen Verteilungsfunktionen 8,„(x) und der Verteilungsfunktion F (=) der Gesamt- 
heit bestehen. Es leuchtet ein, daß die Verteilungsfunktionen 8,(x) und F(x) 
sehr eng miteinander zusammenhängen. 

Zunächst stellen wir fest, daß in einfachen Stichproben für jeden festen Wert x 


P ( iim S.(&) = F@) = 


gilt. Diese Beziehung folgt aus Satz 6.12.3, wenn wir beachten, daß für feste x- 
Werte der Ausdruck 8,(&) die Häufigkeit in einem Bernoullischen Versuchs- 
schema mit p = Fx) ist. 

Ein viel stärkeres Ergebnis enthält der Satz von GLIwEnxo [1]. 


Satz 10.10.1 (GLIwEnko). Es sei S,(x) eine empirische Werteilungsfunktion 
einer einfachen Stichprobe vom Umfang n, die einer Gesamtheit eninommen wurde, 
in der das Merkmal X. die Verteilungsfunktion F(x) hat. Die Wahrscheinlichkeit 
dafür, daß die Folge {S,(x)} für n — oo gleichmäßig bezüglich x (— © <x < oo) 
gegen F (x) konvergiert, ist gleich 1. 

Wir setzen 

D,= sup 18.) — F(e)]. '(10.10.1) 
-RO<e<o < 
Der Ausdruck D, ist ebenfalls eine Zufallsvariable. Der Satz von GLIWENKO besagt, 
daß die Relation 


P( lim D, = ) —=1 (10.10.2) 
besteht. 
Dem Beweis des Gliwenkoschen Satzes lassen wir den Beweis des folgenden 


Lemmas vorangehen. 
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: Lemma. Es sei {A,} (k=1,2,...) eine Folge von zufälligen Ereignissen, und 
es sei 


P(A)=1 (k=1,2,...). (10.10.3) 
Dann gilt die Gleichung 
2 IT A) =1. 
>21 


Beweis des Lemmias. Zuerst beweisen wir die Gültigkeit des Lemmas für zwei 
Ereignisse A, und A,. Ist nämlich P(4A,) = P(4,) =1, dann gilt 


1= P(4, +4,) = P(A,) + P(A,) — P(4,4) =1+1— P(A,4,). 
Hieraus ergibt sich P(A,A,) = 1. Mit Hilfe vollständiger Induktion übertragen 
wir dieses Ergebnis auf beliebig endlich viele Ereignisse; für m = 2,3,... gilt 

PiAA-A)=1. (10.10.4) 


Wir setzen jetzt 

IT Ar = A1(A1 As) (4,A2A,)- = I] Bu 

K21 m21 
mit Bu, = II A;,. Wir sehen, daß für jedes m die Beziehung Bat < Bn gilt; 
die Freignicfalge {B.} ist also abnehmend. Aus Satz 1.3.4. erhalten wir 


ne 


k21 


im P(B,). (10.10.5) 


mM 
Die Formeln (10.10.4) und (10.10.5) ergeben die Behauptung des Lemmas,. 


Beweis des Satzes von GLIWENKo. Es bedeute r eine natürliche Zahl. 
Mita,.(k =1,..., r) sei der kleinste x-Wert, der der Relation 


F(x) < u <F(x +0) (10.10.6) 


genügt, bezeichnet. 8, (x,,.) sei die empirische Verteilungsfunktion einer einfachen 
Stichprobe vom Umfang n an der Stelle x,,,, und A; bzw. A (k=1,2,..,r—1) 
sei das Ereignis, das darin besteht, daß die Relation 


lim max [82 (&,,1) =, F (&,,,) Ir +) - Fr +1] = 0 
bzw. die Relation | 
lim max [|S, (&,% +0) — F(&,% +0)|, | (&r,r+41) — F (&,,%41) I=0 


Nn—>00 
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gilt. Aus Satz 6.12.3 folgt 

PA)=i1 &k=-0,12..,r—l). (10.10.7) 
A” bedeute den Durchschnitt A5A7---A7_,. Das Ereignis A" ist dem Ereignis 

lim max max [/9,(@,.) - Fol, Sn +0) — Fans +] =0 


n>o Iiskgr 


gleichwertig. 
Aus (10.10.7) und der Definition des Ereignisses A” folgt nach dem Lemma die 
Gleichung 


PAN)=1. 
Wir setzen A = 4142 .43.-.. Im Sinne des Lemmas erhalten wir 


P(4)= P( IT \im max max [|8, (8...) — F(&.»)]|, 


121 n—>o0 1Sksr 
Walanı +0) Fa + 1 =0)=1. (10.10.8) 
Nun sei x eine beliebige Zahl, die der Ungleichung x, << %,r1 genügt. 
Es gilt 
Sr, +0) S 8,8) S 9, (&r,aH1) > FÜ. r9)=S Fir) SFr). 
Hieraus erhalten wir 
Sn (&r,r +0) — Flar.an) S 8n(8) — Fr) S Sn ar.) — Fl + 0). 


(10.10.9) 
Da für &,% < %r,4, aus (10.10.6) 


0< Fan) - Fr +0) S 


S [m 


folgt, ergibt sich aus (10.10.9) für k =1,...,r — 1 die Beziehung. 


sap |) Fir) max [kan - Fran)lı 


%,<TSdr,krr 


1 
185, +0) - Fre +] + = 


Daraus folgt die Relation 
mex| sup In) Fla)l, IBalanr +0) — Plans + 0)|| 


ıSTSa,r 


1 
s max max [[9,) - Frl, a - Fre rl rn- 


1<ksr 


(10.10.10) 
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Aus (10.10.10) erhalten wir 
2| lim sup |8,(®) — F(e)| = 0) 


Nn>X0 -WEÄILT<RO 


=P ( lim lim max max [|8,(2,.) — F(&,e)|, |8n(&. +0) — Für, +0) = 0 


n—>o T>00 1Sksr ) 


rZI >00 1Sksr ) 


= P (A lim max max [Sn (&,,%) — F(&,,r) | ’ 18 (Ark + 0) u F (&,% + 0) l 0 


Dies und die Relation (10.10.8) führt schließlich zu 


N>O —- O<I<o 


A sup IN TITT 


Der Satz von GLIWENKO ist damit bewiesen. 


B. Die empirische Verteilungsfunktion kann man auch in der folgenden Form 
schreiben: Es.sei ({X,} (r=1,2,...) eine Folge von Zufallsvariablen. Wir setzen 
für jedes x (— oo <x< oo) j 


0 fü X,>x 
z)= er 10.10.11 
en : für X, <a. ( 
Dann haben wir 
Ha) =). | (10.10.12) 
N r=1 k 


Der Satz von GLIWENKO wurde in verschiedenen Richtungen verallgemeinert. 
Wourowızz [5], [6], [8] verallgemeinerte ihn für den Fall, daß nicht alle Zufalls- 
. variablen X, die gleiche Verteilungsfunktion haben, sowie auf Zufallsvektoren. 

‚Den zuletzt genannten Fall betrachtete auch Brum [1]. Forter und MovRIER 
[1] sowie Fısz [5] verallgemeinerten den Satz von GLIWENKo auf den Fall, daß in 
Formel (10.10.12) die Funktionen f,(X,) allgemeiner sind als die durch (10.10.11) 
definierten Funktionen. TUoKEr [1] verallgemeinerte ihn auf den Fall, daß die 
Folge der Zufallsvariablen X, stationär im engeren Sinne ist (siehe auch VArA- 
DARAJAN [3] sowie Ran@A-Rao [1]). 


10.11. Die Sätze von Kolmogoroff und Smirnow 


A. Die Grenzverteilung der Stichprobenfunktion D,, die durch die Formel 
(10.10.1) definiert wurde, bildet den Gegenstand des nun folgenden Satzes. Wir 


bezeichnen die Verteilungsfunktion der Zufallsvariablen Yn.D, mit 


P(D,Yn <A) =? (D.<) für 2>0, 


0 | für A<0. 


Q,(i) = (10.11.1) 
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Satz 10.11.1. Es sei S,(z) eine empirische Verteilungsfunktion einer einfachen 
Stichprobe vom Umfang n, die einer Gesamtheit entnommen wurde, in der das 
Merkmal X eine stetige Verteilungsfunktion F (x) besitzt. Dann gilt die Beziehung 


5 (—1)F exp (—2Kk222) für A>0, 
lim Q,(A) = Q@(A) =! 1=-o (10.11.2) 


ws 0 für A<0. 


Dies ist der Satz von KoLmocororr [6]; eine Idee des Beweises geben wir in 
10.11.C an. 

In Tafel VIIL am Ende des Buches sind die Werte von Q(A) für einige Werte 
von 4 zusammengestellt. Diese Daten entnahmen wir den Tafeln für Q(A) von 
SMIRNow [1]. 

Tabellen der Verteilungsfunktion Q, (A) für kleine n kann man in der Arbeit von 
"BIRNBAUM [1] finden. 

Wir bemerken, daß die Grenzverteilung Q (A) von der theoretischen Verteilungs- 
funktion F(x) unabhängig ist, von der wir lediglich voraussetzen, daß sie stetig ist. 
Von diesem Gesichtspunkt aus sagen wir, daß D, eine verteilungsfreie Grenzver- 
teilung besitzt. (Eine allgemeine Charakteristik der verteilungsfreien Stichproben- 
funktionen findet man in den Arbeiten von BIRNBAUM [2], BIRNBAUMm und RusIn 
[1] sowie Bez [1].) Ist jedoch die theoretische Verteilungsfunktion F{x) nicht 
stetig, so gilt die Beziehung (10.11.2) nicht. Diesen Fall hat Schmip [1] untersucht, 
der bewiesen hat, daß in diesem Fall der Grenzwert der Funktion Q,(A) von der 
theoretischen Verteilungsfunktion abhängig ist, und zwar von den Wertenvon 
F(&) in den Unstetigkeitspunkten (siehe auch GIcHMAN [3]). 


Beispiel 10.11.1. Es liege ein Posten Schrauben vor, deren Durchmesser gleich sein 
sollen. Genaue Messungen der Durchmesser zeigen jedoch einige Unstimmigkeiten; dabei 
wollen wir aber annehmen, daß bei der Produktion dieser Schrauben keine wesentlichen 
Abweichungen von der festgesetzten Norm vorkommen. Die Meßergebnisse x, die wir als 
Werte der Zufallsvariablen X betrachten, sind dann im allgemeinen normal verteilt. So sei 
zum Beispiel 


fa) = 735 exp (- 3 ( — ») (10.11.3) 
T 


die Dichte dieser Normalverteilung, d. h., die Zufallsvariable X hat die Verteilung N (2; 1/3), 
wobei ein Millimeter als Einheit genommen ist. 

Diesem Schraubenposten entnehmen wir eine einfache Stichprobe vom Umfang rn = 80. 
Wir stellen also 80 Messungen an. Die Meßergebnisse seien der Größe nach angeordnet, also- 
%<% << gg Wir berechnen die obere Schranke der absoluten Differenz |sgg (x) — F(x} |, 
wobei F(x) die Verteilungsfunktion der Zufallsvariablen X ist, während s,,(2) die empirische 
Verteilungsfunktion der Stichprobe darstellt. In unserer Stichprobe haben wir den Wert 
dge = 0,21 beobachtet. Da r ziemlich groß ist, benutzen wir den Kolmogoroffschen Satz und 
berechnen die Wahrscheinlichkeit dafür, daß D,, (x) nicht kleiner als der beobachtete Wert ist. 
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Wirhaben d,, /80 = 0,21 : 8,94 = 1,88 — 4. In Tafel VIII finden wir 


1,88 
P(D. > 0,21) = P (Du > 2) » 1 — Q(1,88) & 0,0017. 


Diese Wahrscheinlichkeit ist von der Ordnung 0,001 und könnte in uns den Argwohn wecken, 
daß die Zufallsvariable X gar nicht nach der Formel (10.11.3) verteilt ist oder daß die Stich- 
probenauswahl tatsächlich nicht nur vom Zufall beherrscht war. Die Methode, derartige 
Schlüsse zu ziehen, besprechen wir in den nächsten Kapiteln. 


B. Wir gehen jetzt zum Satz von SMIRNow über. 


Die Zufallsvariablen X], X12 ---, Xin,» Xoı Aa +.» Xgn, Seien voneinander 
unabhängig und mögen dieselbe Verteilungsfunktion F(x) haben. $,,,{2) und 
* Son, (%) seien die empirischen Verteilungsfunktionen der Stichproben (X, -.: , %ın,) 
bzw. (&21, ..., %n,). Damit sind 8,.,() und S,,, (x) empirische Verteilungsfunk- 
tionen für zwei unabhängige einfache Stichproben aus derselben Gesamtheit, 
in der das Merkmal X eine Zufallsvariable mit der Verteilungsfunktion F (x) ist; 
n, bzw. n, ist der Umfang der ersten bzw. der zweiten Stichprobe. Wir betrachten 
die Zufallsvariablen 


Din, = max ($1n,(2) — San, (2), (10.11.4) 
j -DO<ZE<IXO 

Dim = max |8,,(%) — Sn, (@)l- (10.11.5) 
- XO<SEIO 


NN 
N, + Na 
- funktionen der Zufallsvariablen Yn D;, ., bzw. Vr D,un: 


Mit der Bezeichnung n = seien Q;,.,(4) und Q,,n,(4) die Verteilungs- 


Na 


2 
P(D;.<-—\ für 4>0, 
(A) = | 7) = (10.11.6) 
0 für AO, 
4 i 
pP (Dam < =) für 1>0, 
nn (A) = Vr (10.11.7) 
0 für A<0. 


Es gilt nun der folgende Satz von SMmRNow. 


Satz 10.11.2. 8,,,(0) und 82,(2) seien die empirischen Verteilungsfunktionen 
zweier unabhängiger einfacher Stichproben, die den Umfang n, bzw. n, haben. 
Diese Stichproben seien einer Gesamtheit entnommen, in der das Merkmal X eine 
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stetige Verteilungsfunktion hat. Es gelten dann die Relationen 


. 1 — exp(—222) für A>0, 
+ N 
De Ann (A) = | 0 für A<0; (10.11.8) 
Nz>xX 
—1Y — 1297272) fü j 
no. MIET (10.11.9) 
ee 0° für A <0. 


Wir bemerken noch, daß SMIRNow diesen Satz unter der zusätzlichen Voraus- 
setzung 
N, 


== (>0) 
N, 


bewies. GIcHMAN [1] stellte jedoch fest, daß diese Voraussetzung überflüssig ist. 


C. Interessant ist die Geschichte der. Beweise des Kolmogoroffschen und des 
Smirnowschen Satzes. Die ursprünglichen Beweise waren sehr kompliziert. Einen 
einfacheren, jedoch noch ziemlich schwerfälligen Beweis erbrachte FeLLer [5]. 
Einen kurzen und eleganten Beweis, der sich auf eine heuristische Annahme 
stützte, gab Doos [4] an, die Richtigkeit dieser heuristischen Annahme wies 
Doxsker [2] nach. 

Wir beschränken uns hier da die Idee des Doobschen Beweises von Satz 
10.11.1 anzugeben, und setzen dazu 


U,(x) = Yn(S,(2) — F(@)). 


Da die Verteilungsfunktion F (x) stetig ist, können wir annehmen, daß die Zufalls- 
variable X im Intervall [0, 1] gleichmäßig verteilt ist; anderenfalls betrachten wir 
die Zufallsvariable 7 = F(X), die eine ebensolche gleichmäßige Verteilung 
(vgl. 5.6) besitzt. Wir können also 


-Yals) -) W<r<ı, 
D,Yr = sup IU,(@)| 


0S2&1 


schreiben und leicht die Beziehungen 


E(U,(«)) = 0 (0<e<1), 


en (*) 

E(D, (&)U, (3) =x(1— 2) Mer, 2%,S1) 
finden. Aus dem mehrdimensionalen Moivre-Laplaceschen Satz 6.13.1 folgt, 
daß für r=1,2,3,... und beliebige Punkte &,,..., 0O<m <-.Km,<i) 
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der Vektor (U,(@,), ..., Un (7) asymptotisch normal verteilt ist, wobei die 
Mittelwerte, Dispersionen und Kovarianzen durch die Formeln (*) gegeben 
sind. 

Wir betrachten jetzt einen normalen stochastischen Prozeß {U(2), 0 <r si}, 
d.h. einen solchen Prozeß, für den für r =1,2,3,... und für beliebige x, ..., % 
0<zr,<s..sm,<1) der Vektor (U(x,),..., U(x,)) eine Normalverteilung 
besitzt, deren Mittelwerte, Dispersionen und Kovarianzen durch die Formeln (*) 
gegeben sind. (Die Realisierungen dieses Prozesses sind mit der Wahrscheinlich- 
keit 1 stetig.) 

Die heuristische Voraussetzung von Door besagt, daß die Relation 


Kim P( sup |U,(«)]| = — el „(®)| <a) 


NO 087<S1 Ssısı 


besteht. DooB [4] stellte. fest, daß die rechte Seite dieser Gleichung gleich der 
Funktion Q (2) ist, die durch die Formel (10.11.2) gegeben ist. 

Auch den Satz von SMIRNow kann man mit Hilfe der Doobschen Methode be- 
weisen. Wir wollen jedoch einen anderen vollständigen Beweis dieses Satzes für 


den Spezialfall n, =n,=m, also n = 5 bringen. 
Der Beweis verläuft folgendermaßen: Wir leiten zuerst ein Lemma her, das 


die exakten Verteilungen der Stichprobenfunktionen (>: Dim und N Z Dam 


angibt, gehen dann mit m — co zur Grenze über und erhalten so den Satz 10.11.2. 
Diesen einfachen und scharfsinnigen Beweis erbrachten GnEDEnko und Koro- 
LFUK in der Arbeit [1], die eine Reihe von wichtigen Untersuchungen auf diesem 
Gebiet auslöste, deren Besprechung der Leser in der Arbeit von GNEDENKo [7] 
findet. Später zeigte KoRoLJUK [1], daß die von ihm und GNEDENKO angegebene 
Beweismethode sich auch auf den Beweis des Smirnowschen Satzes in der all- 
gemeinen Form übertragen läßt; sie findet auch beim Beweis des Kolmogoroff- 
schen Satzes Anwendung. 


Lemma. Die Voraussetzungen des Satzes 10.11.2 seien erfüllt. Es geliän dann 
die Relationen 


N) für A<0, 


(10.11.10) 
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_ 
| E 


0 für 4 == Fr! 
Yam 
| 2m ) 
[m/e] ‚\m — ic 5 1 m 
en ee Igel, 
j=—{mfe] 2m Yam 2 
Mm 
i für > YE. (10.11.11) 
l 2 | 
wobei ce = — [-Ay2m]| ist. 


Beweis des Lemmas. Mit y,, Ya --- , Yam bezeichnen wir die der Größe nach 
angeordneten Werte 24], %ı3 ---> Lim» Lay %ays +. am, SodaB Yı <Yy, << Yam 
gilt. Wir führen die Zufallsvariablen 


Z,G=1,2,...,2m) 


ein, die die Werte 1 oder —1 annehmen, je nachdem, ob %; ein Element der ersten 
oder der zweiten Stichprobe ist. Ferner setzen wir 


Es gelten hier die Gleichungen 


mD,,m =m max (Sm(%) — Szm(&)) = max V;, (10.11.12) 
-DO<EIO 0<k<2m 

MDn,m =m max |8m(%) — Sm (z)| = max |V;|. (10.11.13) 
-O@<T<o 0Sks23m 


Die Gleichung (10.11.12) begründet man so: Es ist m (Sm (®) — Sm (@)) für ein 
festes x die Differenz zwischen der Anzahl der Elemente der ersten Stichprobe, 
die kleiner als x sind, und der Anzahl ebensolcher Elemente der zweiten Stich- 
probe, m.D,,, bezeichnet die größte dieser Differenzen, die wir erhalten, wenn x 
das Intervall (—oo, 00) durchläuft. Beachten wir die Definition der Größen Z, 
und V,, so erhalten wir die Gleichung (10.11.12). Ähnlich wird (10.11.13) her- 
geleitet. 

Den weiteren Gedankengang erleichtert die folgende INustration: Wir be- 
trachten die Irrfahrt eines Teilchens auf der t,v-Ebene. Im Anfangsmoment 
t=0 befinde sich das Teilchen im Zustand v»—=0. Das Teilchen unterliegt 
zufälligen Einflüssen in den Augenblicken t=1,2,...,2m, in deren Folge sich 
im Augenblick j(1 =S7 = 2m) seine Ordinatev um 1 oder —1 ändert, jenachdem, 
ob Z;=1 oder Z,= —1 ist. Dabei befinden sich unter den 2m Verschiebungen 
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m, positive und m negative, so daß im Augenblick # = 2m wieder v =0 ist. Wir 
verbinden die Punkte mit den Koordinaten (f,v) durch einen Streckenzug, den wir 
Trajektorie nennen. Dieser Streckenzug ist vom Zufall abhängig, sein Anfang ist 


Abb. 10.11.1 


der Punkt (0,0) und sein Ende der Punkt (2m,0). Eine derartige Trajektorie 
wird durch die dick ausgezeichnete Linie in Abb. 10.11.1 dargestellt. 
Aus Formel (10.11.6) erhalten wir 


Qn,m (A) -r(Y® 05. <ı) — P(mD;,n <AV2m). 


Da mD,,,„ nur ganze Zahlen annimmt, erhalten wir unter Berücksichtigung von 
(10.11.12) 


Ola Bi max V,< ); (10.11.14) 
1SH<2m 
dabei kann c eine beliebige natürliche Zahl sein. 

Die Berechnung der Verteilungsfunktion Q;,,„ (4) wird hier also auf die Berech- 
nung der Wahrscheinlichkeit dafür, daß die beobachtete Trajektorie sich stets 
unterhalb der Geraden v» = c befindet, zurückgeführt. Die Menge aller möglichen 
Trajektorien betrachten wir hier als Menge der Elementarereignisse. Eine Trajek- 
torie ist durch 2m Verschiebungen bestimmt, wobei m Verschiebungen positiv 
und m negativ sind. Mit anderen Worten: Eine Trajektorie ist durch ein System 
von m Zahlen 1 und m Zahlen —1 bestimmt; folglich ist die Anzahl der Trajek- 
torien gleich der Anzahl der Kombinationen von 2m Elementen zu je m, also 


gleich N . Aus der Voraussetzung, daß die Zufallsvariablen X, .--, Xım» 
m 


Kay +--, Xm unabhängig sind und dieselbe Verteilung haben, folgt, daß jede 
Trajektorio dieselbe Wahrscheinlichkeit hat. Diese Wahrscheinlichkeit ist gleich 


1 | & r) Um Q;, m (2) zu bestimmen, müssen wir noch die Anzahl der Trajektorien 
m 
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finden, die sich stets unterhalb der Geraden v% = c befinden. Zuerst wollen wir 
die Anzahl derjenigen Trajektorien bestimmen, die die Gerade v® = c schneiden. 
Zu diesem Zweck gehen wir folgendermaßen vor. Jeder Trajektorie, die die Gerade 
v® = c schneidet, ordnen wir umkehrbar eindeutig eine Trajektorie zu, die bis zum 
ersten Schnittpunkt mit der Geraden v = c identisch mit der ersten ist und die, 
von diesem Schnittpunkt angefangen, die symmetrische Spiegelung der ur- 
sprünglichen Trajektorie an der Geraden v = c ist. Den Verlauf der neuen Tra- 
jektorie rechts vom ersten Schnittpunkt mit der Geraden v =1 stellt die punk- 
tierte Linie in Abb. 10.11.1 dar. Die neue Trajektorie endet im Punkt (2m, 2c). 
Die Zahl der Verschiebungen nach oben beträgt m + c, die Anzahl der Ver- 
schiebungen nach unten m—.c. Die Gesamtanzahl dieser Trajektorien ist 


( em -( an ) Damit ist die Anzahl der Trajektorien, die nicht an die 


mc m—c 


Gerade v =c heranreichen, gleich (7) — ( ” ) Da alle Trajektorien mit 
m m — 


derselben Wahrscheinlichkeit auftreten, erhalten wir fir 0<AS y? aus 
(10.11.14) 2 


Fee 
um) = FF -1- g (10.11.15) 
(") () 


Wenn wir noch die offenbar gültige Gleichung Q,n(4) =! (A=0) beachten 


und schließlich die Tatsache, daß für A > u auch c > m ist, während doch 


keine Trajektorie die Gerade v = m überschreiten kann, so daß also m) = 
für 1> yz gilt, so erhalten wir die Relation (10.11.10). 


Wir gehen nun zum Beweis von (10.11.11) über. Zunächst bemerken wir, daß 
analog zur Gleichung (10.11.14) die Beziehung 


Qnm(d) =P (Vz Diss ) 


= P(mD„m<e) = P( max |Y,| < ‘) - (10.11.16) 


1sks2m 


zilt. Auch hier führt die Berechnung der Verteilungsfunktion Q,„,m (A) für jedes 
natürliche ce auf die Bestimmung der Wahrscheinlichkeit dafür, daß sich die beob- 
achtete Trajektorie zwischen den Geraden v = —c und v = befindet, ohne die 
beiden Geraden zu schneiden. 
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Wir bezeichnen die Gerade v =c mit «, die Gerade v = —c mit ß und die 
Menge aller Trajektorien mit A. Wie schon bekannt, befinden sich in A genau 


2 
( Elemente. Mit A, bezeichnen wir die Menge derjenigen Trajektorien, die 
m 


zwischen den Geraden & und ß liegen und sie nirgends schneiden. Mit A, bezeich- 
nen wir die Menge derjenigen Trajektorien, die wenigstens einmal die Geidde & 
schneiden, mit A, die Menge aller der Trajektorien, die wenigstens einmal die 
Gerade & und dann die Gerade ß schneiden, mit A, die Menge der Trajektorien, 
die wenigstens einmal die Geraden & und f in der Reihenfolge «, f, & schneiden. 
Allgemein bedeutet A,;-ı die Menge der Trajektorien, die wenigstens einmal die 
Geraden a und $ in der Reihenfolge «, ß, ..., & schneiden (« tritt hier s-mal, ß tritt 
“ (€ — 1)-mal auf, während A;,; die Menge derjenigen Trajektorien ist, die wenigstens 
einmal die Geraden « und $ in der Reihenfolge a, ß, ..., a, ß (« und ß treten hier 
je ö-mal auf) schneiden. Ähnlich bedeutet B,;, die Menge der Trajektorien, die 
wenigstens einmal die Geraden & und ß in der Reihenfolge ß,«,...,ß (ß tritt - 
i-mal, & tritt (* — 1)-mal auf) schneiden, während B;; die Menge derjenigen Trajek- 
torien bezeichnet, die die Geraden & und £ wenigstens einmal in der Reihenfolge 
ß,%; ...,ß,& (ß und « je i-mal) schneiden. Dann läßt sich leicht die Beziehung 


A=A+ & [KAsiı — Ası) + (Bai-ı — Bai)] - (10.11.17) 
il : 


beweisen. Dabei haben die Mengen in den eckigen Klammern für verschiedene i 
leeren Durchschnitt. Wir zeigten oben, daß die Anzahl der Elemente von 4, 


(also auch von B,) gleich | 2m ist. Um die Anzahl der Elemente von 4A, 
m — 6 


zu finden, ordnen wir jeder zur Menge A, gehörigen Trajektorie in zwei Schritten 
umkehrbar eindeutig eine neue Trajektorie zu, die bis zum ersten Schnittpunkt 
mit der Geraden & identisch mit der ursprünglichen ist. Im ersten Schritt spiegeln 
wir die ursprüngliche Trajektorie von diesem Schnittpunkt, angefangen an der 
Geraden v® =c. Die so entstehende Trajektorie verfolgen wir bis zum ersten 
Schnittpunkt mit der Geraden » = 3c. Von diesem Schnittpunkt angefangen, 
spiegeln wir die im ersten Schritt konstruierte Trajektorie an der Geraden v = 3ec. 
Diese neue Trajektorie ordnen wir der ursprünglichen zu; sie endet im Punkt 
(2m, &c). Die Anzahl der Verschiebungen nach oben beträgt also m + 2c, die An- 
“zahl der Verschiebungen nach unten m — 2c. Die Anzahl der Elemente von A, 


ist also gleich | z ) Dieselbe Anzahl von Elementen hat auch die Menge B, 
e 


In Abb. 10.11.1 zeigt die gestrichelte Linie rechts vom Sehnittpunkt mit der 
Geraden v =3 den Verlauf der neuen Trajektorie. 
Ähnlich kann man zeigen, daß die Anzahl der Elemente von A; (also auch von 


_ B;), wobei j< Rt gleich \, ı ist. Aus (10.11.17) erhalten wir, daß 
c m — jC 
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die Anzahl der Elemente von A, gleich 


2m Im 2m [mie] .[ 2m 
| „) . 22: In — (2i — 5 n ® _ a) e _ N 


Wenn wir berücksichtigen, daß alle Trajektorien mit derselben Wahrschein- 
lichkeit auftreten, erhalten wir aus (10.11.16) die Beziehung 


ist. 


| = ) 
Qnm(A) = = a ee, > <as2) (10.11.18) 
j=-Imle] (7) 2 
m 


Ist A RM dann ist cs1. Da max |V,| größer als Null ist, erhalten 
Y2m I<Sk<2m ee 
m 


wir Qm,m(A) = 0 für diese }. Wenn dagegen A > V 5 ist, so ist c > m, und für 
solche 4 ist Q,m (A) =1. Die Relation (10.11.11) wurde damit vollständig bewiesen. 


D. Beweis des Smirnowschen Satzes. Wir gehen nun zum Beweis des 
Satzes 10.11.2 über und setzen dabei voraus, daß rn, =n, = m ist. Für 5j = 1, 2, 
3,... haben wir 


nf 2m \.fem_ mr 
A er 


Wenn wir ähnlich wie in 10.5 schließen, erhalten wir bei Beachtung der Stirling- 


schen Formel r! » (2) Y2rr und der Näherungsgleichung c = A Y2m die 
e 


Formel 


Daraus ergibt sich 
log I; = — 27222 + Ymo (5) 
mM 
Schließlich erhalten wir 
lim I; = exp (—2j?22). (10.11.19) 


M>XO 


Gehen wir in der Formel (10.11.10) mit m — oo zur Grenze über und beachten 
wir dabei gleichzeitig die Formel (10.11.19) für 57 =1, so erhalten wir (10.11.8). 
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Um (10.11.9) zu beweisen, bemerken wir, daß man zu jedem A > 0 und jedem 
&e > 0 ein j, > 0 finden kann derart, daß 


exp (—2/222) < R (10.11.20) 


ist. Aus dem Leibnizschen Satz ergibt sich dann 


3 (—Nexp(—27°4°) 


Hl>% 


<2exp(—2(j, + 1)222) < = (10.11.21) 


Wir setzen 


„<lilsimle] 


2m 


m—(+De 
Ungleichung 2 > Am gilt, gilt auch 
m — j6 m—(j— De 


mel 
IR|<4 \m — 906] 
2m 
(nm) 
Diese Ungleichung und die Formeln (10.11.19) und (10.11.20) führen für ge- 
nügend große m zu 


Da für 5 > 0 die Ungleichung | 2 > | ) und für ;<O0 die 
m — sc 


RI<2. 
21<; 
Dies und die Ungleichung (10.11.21) ziehen die Relation 


R— 3% (-Diexp (-22°7°) 


171 >50 


< z (10.11.22) 


nach sich. 
Andererseits folgt aus (10.11.19), daß für genügend große m die Ungleichung 


en 
PH (—1} \m — je} — exp(— 27222) < 


His 2m 
m 


€ 
en 10.11.23 
2 ( ) 
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erfüllt ist. Gehen wir in (10.11.11) mit m — oo zur Grenze über und benutzen wir 
die Ungleichungen (10.11.22) und (10.11.23), so erhalten wir (10.11.9). 

Tafeln für die Verteilungsfunktionen Q,,,„ (4) und Q,,m (4) kann man für kleine 
m bei Massey [2] finden, ebenso bei Sapowsk1 [1] und Janko [1]. 

Es sei ausdrücklich betont, daß möglichst exakte Tafeln für Q,,,. (2) benutzt 
werden müssen, denn Q,,m (4) kann, wie von Hopezs [1] gezeigt wurde, selbst 
für ziemlich große m von der Grenzverteilung @ (A) bedeutend abweichen. 


Beispiel 10.11.2. Wir entnehmen ein und derselben Gesamtheit, deren Merkmal X stetig 
verteilt sei, zwei unabhängige einfache Stichproben zu je 4 Elementen. Dabei beobachten 
wir die Größen 


Zu =1, a=3, = -T, um, 
mb, au, ut, um. 
Wir haben hier 


Y=-, ph %=9, y=l, %=-2, Ys 3, Y% 6, % 8, 
also j 


nB=l 3=-1 3=-—-1, ,=1, 3=1, 3=1, 2, =-1, 3= —1, 


vl, 9-09, u =-—l yv=0d, el, y=2 vl, n=d. 


Die beobachteten Werte der Zufallsvariablen D/‘, und D,, betragen dj, = du = 5 Wir 
suchen die Wahrscheinlichkeit dafür, daß wir nicht kleinere Werte als die beobachteten. er- 
halten. Es gilt hier an = 22 also A = = und c=2. 
Y 2? Y2 
Aus (10.11.10) erhalten wir Q}, (03) = 0,6, d.h, die Wahrscheinlichkeit dafür, daß Di, 
nicht kleinere Werte als 5 annimmt, ist gleich 0,4. Aus (10.11.11) erhalten wir Qu. ulys 5) 
= 0,229. Die gesuchte Ergänzung zur Eins beträgt also 0,771. 


Beispiel 10.11.3. Wir entnehmen zwei einfache unabhängige Stichproben einer Gesamt- 
heit, deren Merkmal X stetig verteilt sei. Der Umfang der ersten Stichprobe sei n, = 70, 
der der zweiten Stichprobe », = 100. Wir beobachteten nun den Wert der Zufallsvariablen 
"Da,n, Er betrage d,,,n, = 0:18. Wie groß ist die Wahrscheinlichkeit dafür, daß D,, „, kleiner 
als dieser beobachtete Wert ist? 

NN, 
N, + Na 
des Smirnowschen Grenzwertsatzes 


Es gilt hier n — = 41,2, Yn=6,42, 1 = 0,18-6,42 — 1,16, also auf Grund 


1,16 
P(Dy,.n. < 0,18) = P (Dun < ) = Q(1,16). 


6,42 


In Tafel VI finden wir Q(1,16) x 0,8644. 
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E. Wir geben noch einige weitere Informationen. Es sei 


D} = Sp Ste) — F(e)), 


-0<r 


D,, N. max (San, (x) er Sun (@)) =-— min „es 1m (8) — Syn (@)). 
—-DO<E<RO -w<e< 
Einen Ausdruck für die genaue Verteilung der Stiehprobenfunktion D} 
haben Warp und WoLFrowızz [1] und später BIRNBAUM und Tınazy [1] angegeben. 
Unter der Voraussetzung, daß die Bedingungen des Satzes 10.11.1 erfüllt sind, 
hat N. W. SMIRNow [1], [2] gezeigt, daß für A > 0 


lim P(DiYn < 4) =1 — exp (-222) (10.11.24) 
no 
gilt. 
In den zitierten Arbeiten hat SMIRNow die Grenzverteilung des Zufallsvektors 
(Di... Di.) wit n = 2 angegeben. 


GNEDENKO und RWATSCHEWA [1] fanden f für nn =n, =m die exakte zwei- 


dimensionale Verteilung des Vektors IE 3 mD, m: Y; nDz..) und berechne- 


ten den Korrelationskoeffizienten zwischen D,,„ und D,m 
. N. W. Smmrvow [2] untersuchte die Grenzverteilung für die Anzahl der Schnitt- 
punkte der empirischen Verteilungsfunktion $,,, (x) mit der Kurve 


SER en 


NıNz 


MICHALEWITSCH [1] fand für rn, =n, die exakte Verteilung für die Anzahl 
dieser Schnittpunkte. 

Die Verteilung einer Stichprobenfunktion, die mit der Stichprobenfunktion D 
eng verknüpft ist, untersuchten BIRNBAUM und Pyke [1] auch Re 
10.14.19). 

Kac [3] untersuchte die Verteilung der Säakyrabsntunktion D, unter der Vor- 
aussetzung, daß n eine Zufallsvariable mit Poissonverteilung ist. 

Zu gewissen Ergebnissen in Richtung einer Verallgemeinerung des Satzes 
10.11.1 von KoLMoGororr sowie der Beziehung (10.11.24) für Zufallsvektoren 
kamen KıErFER und Worrowrrtz [3]. 


10.12. Der Satz von Renyi 


R&nyı [3] modifizierte den Satz 10.11.1 von KoLMoGOROFF folgendermaßen: 
Im Kolmogoroffschen Satz untersucht man die Differenzen |8,(x) — F(z)|, 
ohne den Wert von F (x) zu berücksichtigen. So kann zum Beispiel diese Differenz 
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im Punkt x den Wert 0,01 haben. Wenn in diesem Punkt Fix) = 0,5 ist, so be- 
trägt die Differenz 2%, des Wertes von F (x). Ist in diesem Punkt aber F(x) =0,01, 
so beträgt die Differenz 100% des Wertes von F (x). Diese Möglichkeiten werden 
beim Kolmogoroffschen Satz nicht unterschieden. Rünyı schlägt nun vor, anstelle 
)—F 
der Differenz 8,(x) — F(x) die Stichprobenfunktion nn 
x 
suchen. Die Voraussetzungen des Satzes 10.11.1 seien erfüllt. Rexyı hat nun 
bewiesen, daß dann für beliebiges « > 0 die folgenden Beziehungen gelten: 


lim (1 sup a) Fe) < ) 


n—00 G«<SF(x) F (z) 


zu unter- 


" für AS0O, 


„9 i (10.12.1) 
E f exp (- 2) di für 1>0, 
0 


T 


ER 8,2) — Fi) ) 
im PfYn suop | <A 
n—X (v BR F(«) 
0 für As0, 
= er E + m (10.12.2) 
4 © ; 8 al? 
Bei —1j ———— für >90. 
| 7 En 27+1 


Das Supremum auf der linken Seite dieser Formeln wählten wir für alle diejenigen 
Werte x, für welche F(x) > a mit beliebigem «a >0 ist. 

Dieser Satz kann mit Nutzen in der Praxis angewandt werden. 

Tafeln für die rechte Seite von (10.12.2) hat Räxvi in der schon zitierten Arbeit 
[3] angegeben. 

Die Verteilung der Stichprobenfunktion 


Bu Sn (x) F(x) 
a Trug 


für endliche n hat Isum [1] angegeben (siehe auch Aufgabe 10.14.22). 

Schmip [1] verallgemeinerte den Satz von Räxyı für den Fall, daß die Ver- 
teilungsfunktion F(x) Unstetigkeitsstellen aufweist. 

Wang [1] hat für die empirischen Verteilungsfunktionen $,,,(2) und $,,, (x) 
von zwei unabhängigen einfachen Stichproben, die aus derselben Gesamtheit 
mit einer stetigen Verteilungsfunktion stammen, eine der Formel (10.12.1) 
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ähnliche Formel angegeben. Er bewies nämlich, daß die Relation 
lim P (Vm- sup San) Em) _) 
Na N, + Na a<Sgn,(8) Son, (x) 


° für AO, 


für beliebiges a > 0 erfüllt ist, wenn für n, — oo und n,— oo die Relation 


Mm .asi 
Na 
gilt, wobei d eine gewisse Konstante ist. 
CHane [1] fand die exakte Verteilung der Zufallsvariablen 
En Sn (&) i Sr Sn(z) 1 
o<r@)sa F(X) o<s,.(@)sa F(R) 


wobei a konstant und 0 <a <si1 ist. 


ManısA [1] untersuchte die Verteilungen.der Stichprobenfunktion 


sup |8,(@) - Fa)], 

a<a<d 
wobei a und b gewisse Konstanten sind. Kwır [1] untersuchte die Verteilung der 
Stichprobenfunktion 

up 1a) —- Fi). 

—-0<ISa, DSLE<RO 
Die Modifikationen der von R£&nwyı, CHuAang, MAnısA und Kwır untersuchten 
Stichprobenfunktionen von KOLMOGOROFF und SMIRNOW sind Spezialfälle der 
folgenden von ANDERSoN und DArLIng [1] untersuchten Stichprobenfunktionen: 


D* = sup Yn |8,(&) — Fa)|plF(@)], 


=X<T<o 


D* = sup Yn[S,@)— Fe)]ylF@)]; 
-@o<r<o 
hierbei bedeutet y eine gewisse Funktion. 
Gewisse Modifikationen und Verallgemeinerungen der Kolmogorofischen und 
Smirnowschen Stichprobenfunktionen wurden ferher in den Arbeiten von RwA- 
TSCHEWA [1], Tsao [1], Kvıpee [2], Vincze [1], [2] sowie Dwass [1] behandelt. 
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Eine umfangreiche synthetische Beschreibung der Problematik um die Kolmo- 
goroffschen und Smirnowschen Stichprobenfunktionen findet der Leser in der 
Arbeit von Daruıne [1]. 


10.13. Das Problem mehrerer Stichproben 


A. Der Satz 10.11.1 erlaubt es zu entscheiden, ob das Merkmal X in der Gesamt- 
heit, welcher die betrachtete Stichprobe entnommen wurde, eine vorgegebene 
stetige Verteilungsfunktion F (x) hat. Mit Hilfe des Satzes, den wir jetzt angeben, 
"können wir entscheiden, ob das Merkmal X in k (k> 2) Gesamtheiten, aus denen 
die k Stichproben gezogen wurden, dieselbe vorgegebene stetige Verteilungs- 
funktion F(x) besitzt.. 

Wir betrachten also k (k>2) Gesamtheiten, in denen das Merkmal X dieselbe 
stetige Verteilungsfunktion F(x) hat. Jeder dieser Gesamtheiten entnimmt man 
eine einfache Stichprobe vom Umfang n. Dabei seien die einzelnen Stichproben 
voneinander unabhängig. Anders ausgedrückt, wir haben esmit »- k unabhängigen 
Zufallsvariablen X, ---; Xım Kan» Kam +» Akt; An Zu tun, die dieselbe 
Verteilung haben und in % Gruppen eingeteilt wurden; dabei liegt über jede dieser 
Zufallsvariablen eine Beobachtung vor. Wir bezeichnen mit $,;(x) die empirische 
Verteilungsfunktion der j-ten Stichprobe, d.h. derjenigen Stichprobe, die aus der 
jten 5 =1,2,...,%) Gesamtheit stammt. Weiter setzen wir 


Din,;) = n sup Sue) - Fol G=12..,h, 


- (10.13.1) 
M,„ = max D(n, j). 


'ı1sjsk 


Die Zufallsvariablen D(n, 5) (7 =1,2,...,k) sind unabhängig und haben dieselbe 
Verteilung. 


Satz 10.13.1. Es seien 8,,(®) (j = 1, ..., k) die empirischen Verteilungsfunktio- 
nen von k unabhängigen einfachen Stichproben aus Gesamtheiten, in denen das 
Merkmal X die gleiche stetige Verteilungsfunktion F (x) hat. Dann gilt 


lim P(M, <A) =[QW)%, | (10.13.2) 


N>XO 


wobei Q(}) durch die Formel (10.11.2) gegeben ist. 


Beweis. Im Sinne von Satz 10.11.1 bestehen die Relationen. 


lim P(D(n, 5) <) =Q() gG=1,2,...,h. (10.13.3) 


Da das Ereignis (M„ <A) dem vereinten Ereignis (D(n, 1) <A, ..., D{n, 4 <A) 
gleichwertig ist und die Zufallsvariablen D(n,5) 7 =1,2,...,k) voneinander 
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unabhängig sind, erhalten wir aus (10.13.3) 
lim P(M,„ <A) = Im P(D(n, 5) <4;j =1,...,k) 
Nn>X 


NO > 


ER: 
-H lm PD) <A, = [QMF. 
j=1 >00 
Damit ist der Satz.bewiesen. 

Es ist klar, daß die Voraussetzung über die Gleichheit der Stichprobenumfänge 
unwesentlich ist. Wenn die Stichprobenumfänge nicht gleich sind und n; der Um- 
fang der j-ten G =1,2,...,k) Stichprobe ist, so bleibt der Satz richtig, falls 

_ allen; gegen Unendlich streben. 


B. Wir bringen nun einen Satz, der eine Verallgemeinerung des Smirnowschen 
Satzes für k (k = 2) Stichproben darstellt. 
Wir betrachten %k Stichproben mit den in 10.13.A genannten Eigenschaften; 


n; und Son, @)G=1,2,...,%) mögen die Gliederzahl bzw. die empirische Ver- 
teilungsfunktion der j-ten Stichprobe bedeuten. Wir setzen für i=1,2,..., k—1 

F : ns 

A} (np...) = max SB, In; 8;.,(@), (10.13.4) 

, . —w<a<o jel 

: u 
AN, ...,%%) = max B;n, V%%5 Si, (@) |» (10.13.5) 
-o<e<o |j=1 


wobei die B,,, Konstanten sind (die von den Argumenten n,, N ..., 7%, 0,5 ab- 
hängen). ; 

Satz 10.13.2. Es seien die 8,(@) G=1,2,...,k) empirische Verteilungs- 
funktionen von k einfachen Stichproben, die aus k Gesamtheiten entnommen wurden, 
in denen das Merkmal X die gleiche stetige Verteilungsfunktion hat. Ferner nehmen _ 
wir an, daß die Beziehungen 


k EN 4 
N Bin, Vn; = 0 G=1,2,..,k-1), (10.13.6) 
je 
im By=By (G=12.,.k-1j=12%...,h 
MIR er NETTO 
10.13. 
gelten, wobei (10.13.7) 
e f0 fü h#+i 
BuBy = j 10.13.8 
nt | 1 für hzi I 
ist. Dann gelten für beliebige positive Zahlen Ay, As, --- ; Ay-ı, A die Beziehungen 
im PA (in, No...) <A, i3=1,23,..,k—1) 
MR... Ne > b 
k—1 
=/I (1 - exp (-2%)), (10.13.9) 
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lim P(A:(nı, N...) <A,i=1,2..,k—1) 


N, NO 


-]7 9A), (10.13.10) 


wobei Q(},) durch (10.11.2) gegeben ist, sowie 


lim A max A} (n,, ng ..-,%) < 2) 


9>0,.,N15>00 \lSisk—1 


= (1 — exp (— 22), - (10.13.11) 


lim P( max A;(n, N...) < 4) 


Nr>00,.., 0,700 1Sisk—1 
=(Q A): (10.13.12) 
Diesen Satz haben Fısz [4], Cuane und Fısz [1] sowie KıErer [1] bewiesen. 
Es liegt auf der Hand, daß man verschiedene Koeffizienten B,, wählen 
kann, die den Gleichungen (10.13.6) bis (10.13.8) genügen. Setzen wir zusätzlich 


voraus, daß 


im =a>0 (G=2,...,k) 


no N 
gilt, so können wir das Koeffizientensystem 


— Ynnaa] NN für je1,2,...,i, 


Ba, = YNdNiu für j=i+l, (10.13.13) 
0 für J=i+2,...,k 
betrachten, wobei N, = nı + N, +---+ n, ist. Wir können dann 


A; (MN...) = YmnN:lNin D/(N nn); 
A:{n,, N) = VrıNilN iu DAN. rn) 


schreiben, wobei 


1.4 
D/ (N, nu) = max [Sm (2) — N. 2 N;8;, | ’ 
z : je 


(10.13.14) 


D(N,n) = ma 
ae 


1 i 
Syn (®) — Sn, ®) 
N; ;1 
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gilt. Für k =4 haben wir z. B. die folgenden drei Zufallsvariablen: 


D,(N,,%,) = max San, (2) — San, («)|; 


T 


Dy(N,,n) = max |San, (0) — me) + raöen |, 
x NT Re | 

N, Sun, (&) + Nasen, (&) + Ny Sn, @)| 

NN, + N, | 


D(N,n,) = aua2 San, (x) — 
T 


Wie CHang und Fısz [2] sowie Kırrer [1] gezeigt haben, sind die Zufalls- 
variablen D(N,,n,), ..., Di_ı(Na-1, 7%) unabhängig. Das gleiche gilt für die 
Zufallsvariablen D, (N,, No), .--, Di-ı (Nr-ı, %)- 

GicHMAN [5] und KıErer [1] haben eine andere Verallgemeinerung des 
Smirnowschen Satzes für k Stichproben gegeben, und zwar bewiesen sie den 
folgenden Satz: 


Satz 10.13.3. Es seien die 8,,(@) 5 =1,2,...,k) empirische Verteilungs- 
funktionen von k einfachen Stichproben, die aus k Gesamtheiten entnommen wurden, 
in denen das Merkmal X die gleiche stetige Verteilungsfunktion hat. Wir setzen 


k 
Di...n = max 2 N; (Sin, (x) ya Sc (@))?. 


-&<r<o j=1 


4 SR 


2 
Sen serie (- 5) (10.13.15) 
T E (k — 0) (222) #-Di2 °=1 (Ja-a12 (4s))? 272 
2 


wobei u, die positive s-te Wurzel der Besselschen Funktion Jg-3)72(2) ist. 

Sämtliche Sätze aus 10.13.B haben wir ohne Beweis angegeben, da die Wieder- 
gabe der Beweise über die Grenzen dieses Buches hinaus geht. Der Grundgedanke 
der Beweise ist der Grundidee zum Beweis des Satzes von KoLMOGOROFF ähnlich, 
den wir in 10.11.C0 gegeben hatten. 

Andere Verallgemeinerungen des Smirnowschen Satzes für den Fall von drei 
Stichproben, die mit elementaren Methoden hergeleitet wurden, findet der Leser 
in den Arbeiten von Ozous [1] (vgl. Aufgabe 10.14.20) und H. T. Davıo [1], und 
für eine beliebige endliche Anzahl von Stichproben in der Arbeit von BIRNBAUM 
und Hart [1] (siehe auch Dwass [2]). 
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10.14. Aufgaben und Ergänzungen 


1. Einer Grundgesamtheit, in der das Merkmal X die Normalverteilung N(0;1) hat, 
wurde eine einfache zehngliedrige Stichprobe entnommen. Dabei erhielt man die Werte 
a=0I, n=02, ,=025, nn = 03 = 01, ,=2, ,=015, 5-1, 
= 0,7, 2 = —1. 

a) Man bestimme die empirische Verteilungsfunktion $,(z) dieser Stichprobe. 
b) Man berechne Z(8, ()) und D:(8, («)) an der Stelle x = 0,2. 
c) Man berechne ®,,(x) für k=6,n = 10 und x = 0.2. 


2. Es sei {9 Positionsfunktion einer aus einer Gesamtheit entnommenen einfachen Stich- 
probe, in der die Eigenschaft X die stetige Verteilungsfunktion F{x) hat. Man zeige, 
daß die Zufallsvariable F(£{®) die Betaverteilung mit den Parametern kund n — k+1 
hat. 


3. Man beweise, daß man die Behauptung des Satzes 10.4.1 unter den gleichen Voraussetzun- 
gen durch eine schärfere Behauptung ersetzen kann, und zwar, daß die Folge {£{®} für 
n —0o mit der Wahrscheinlichkeit 1 gegen a; konvergiert. 


Hinweis. Man beweise, daß für jedes e> 0 


SP —a|> e)<oo 


n=1 


gilt, und wende dann das Lemma von BOREL-CANTELLI an. 


4. Es sei ®,„(x) durch die Formel (10.3.6) definiert, und es sei k konstant. Man zeige, daß 
für jedes x die Ungleichung 


it& nF(x2) 1+b, nF (x) 
2. erde < due) S Ra r fe etgk1dx 
kn! Di, 


1)! J 


gilt; F(x) ist die theoretische Verteilungsfunktion, a,> 0, 5,>0, lima, = lim b, = 0. 
Nn>X n—X 
5. Es sei {£{} eine Folge von Positionsstichprobenfunktionen bei konstantem k, und es sei 


“_ F(&) die theoretische Verteilungsfunktion. 


a) Man zeige, daß die Folge {£{® — A{®}, wobei die A{} gewisse Konstanten sind, dann und 
nur dann stochastisch gegen Null konvergiert, wenn für jedes e> 0 die folgenden 
Beziehungen erfüllt sind: 


imnPF(A® _)=0, limnF(A®r + e)— 
No n>X 
Hinweis. Man verwende die Aufgabe 4. 
b) Man löse eine analoge Aufgabe fürk=n — 1 -+ 1 bei konstantem I. 
6. (Fortsetzung) a) Man zeige, daß die Folge {£{®— x,}, wobei k konstant ist, für n —oo 


stochastisch gegen Null konvergiert, werin für ein gewisses x, stets F(x) =0 für 2=<x, 
und F(a)>0 für > m, gilt. 


b) Man formuliere und beweise ein analoges Ergebnis, wenn für ein gewisses x, stets 
Fee) <i1 für <a, und Fea)=1 für >22, gilt. 
Hinweis. Man stütze sich auf die Aufgabe 5. 
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7. Man beweise: 

a) Gilt F(x)> 0 für jedes x, so ist dieFolge {&{ — A{}, wobei k konstant ist, für eine 
gewisse Konstantenfolge {A{®} für n—0oo dann und nur dann stochastisch gegen Null 
konvergent, wenn für jedes e > 0 die folgende Relation erfüllt ist: 

F(& — e) u 


1 PER EEE! 


on FR) 
b) Gilt F(&x) < 1 für jedes x, so konvergiert die Folge ic — am, k=n—I-+1 bei 
konstantem für n—0oo dann und nur dann stochastisch gegen Null, wenn für jedes 
& > 0 die Beziehung 


1-Fa+e_ 


lim =0 


oo 1-F@) 
erfüllt ist (für k=i oder k=n siehe GNEDENRO [8], für den allgemeinen Fall 
N. W. Smirnow [3]). j 
8. Es seien F(x) bzw. 0; (0 <A < i) die Verteilungsfunktion bzw. das Quantil der Zufalls- 
variablen X. Ferner sei £{” das Quantil einer n-gliedrigen einfachen Stichprobe. Man zeige: 
Soll für gewisse Folgen von Konstanten a, > 0 und b, die Beziehung 


mM _H 2 
lim P (E—* < ) = — f e’Rdz 


Nn—>00 In 


gelten, so ist notwendig und hinreichend (N. W. Smirxow [3]), daß für jedes x die Beziehung 


li 
n—oo yAi—A) 
erfüllt ist. 


9. Es seien F(«), (x), a,, bzw. a,, (<A, <A,< 1) die Verteilungsfunktion, die Dichte- 
funktion bzw. Quantile der Zufallsvariablen X. Ferner seien £{® und £{ (,=[nA,]+1, 
k, = [nA,} + 1) Quantile einer einfachen Stichprobe. Man zeige: Ist die Dichtefunktion 
/(@) stetig und positiv an den Stellen e=a;,, und x=a,,, so ist der Zufallsvektor 
(Em, &) für n —oo asymptotisch normal verteilt mit den Parametern 


 Flne tb) — A — 
m ——— Ya=s 


MS: MA, 


a_hU-h „_AU-h) je» a), 
In (fa)? = n(f(a;))? ö Alt — A) 


Man verallgemeinere dieses Ergebnis fürr (r> 2) Positionsstichprobenfunktionen. 


10. Es sei {ep} eine Folge von Stichprobenfunktionen bei konstantem k, und es sei F(«) 
die Verteilungsfunktion der Zufallsvariablen X in eimer Grundgesamtheit. Man beweise: 
Soll für gewisse Folgen von Konstanten a, > 0 und b, die Beziehung 


a z 
En _ 5 0 für z2<S0, 
lim P rn < ) en 1 z 


u ö 
N Ay En! } e*zt1dz für 2>0 
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11. 


12. 


13. 


14. 


gelten, so ist notwendig und hinreichend, daß 


0 für <S0, 
limnF(a,x-+b,) = : 
n—>00 z für 2e>0 
ist (GNEDENKOo [8], N. W. Smmrnow [3]). 


Man zeige, daß die Zufallsvariablen Zi) und U{® (siehe 10.6) für n >00 asymptotisch 
unabhängig sind. 


Es seien &W, c®,...,2{® Positionsfunktionen einer einfachen Stichprobe, die aus einer 
Gesamtheit herausgegriffen wurde, in der X im Intervall [0, 1] gleichverteilt ist. Man 


beweise, daß die Zufallsvariablen P,, V3, ..., Y„, wobei 
gm em, 
V7,= Fa MY. = Em’ „im 
2 Rn 


gesetzt ist, unabhängig sind und daß darüber hinaus Y, (=1,2,....”»—1) im Intervall 
[0, 1] gleichverteilt ist (Marmoauıst [1]). 


Es seien £{® und £{? Positionsfunktionen einer einfachen Stichprobe, die aus einer Gesamt- 
heit entnommen wurde, in der das Merkmal X die Verteilungsfunktion F(x) und die 
Dichtefunktion f(x) besitzt und. F (0) = 0 ist. Man zeige: Eine notwendige und hinreichende 
Bedingung dafür, daß /(x) die Form 


1 : 
eı am für O<zsb, 
.Io)=3 (*) 


1) für <<0,.>b 


hat, ist die Unabhängigkeit der Zufallsvariablen Y, und P,, wobei 


au (2) 
vr == ce , y, I C5 
gesetzt ist. Wenn darüber hinaus in der Formel (*) für die Dichtefunktion /(«) noch 
b = 1. gesetzt ist, so hat V, auch eine Verteilung, die durch dieselbe Dichtefunktion 


ausgedrückt ist (F152). 
Man zeige (Tsomesonx [1]): Ist F(x) eine stetige Verteilungsfunktion und ist a,,, deren 
Mediane, so gilt 

2 


0,5 
[era or tar. 
Bik,n—k+1) 


0 


PD <aun<iP,.)=1- 


Hinweis. Man beachte, daß F (x) im Intervall [0, 1] gleichverteilt ist. 


. Man zeige, daß die Dichtefunktion h(w) der Breite W einer einfachen »-gliedrigen Stich- 


probe, die aus einer Gesamtheit entnommen wurde, in der das Merkmal X die Dichte- 
funktion f(x) hat, die folgende Form besitzt: 


x 


n(n — 1) [ Fu) Fa + w) [F(w + u) — Fa)" ? du für O<w<o, 


0 für w<O. 
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16. a) Man beweise: Ist F(x) eine stetige Verteilungsfunkiton, so hat die Stichproben- 
funktin W = PL <SX<sL)mit u, =" und, =L{,., (k<n—k-1j} die 


n—H 


Dichtefunktion 
m! Pe 2k-1 
— gti — für O<e<i, 
h(w) = 3 (n — 2k)!(2k — 1)! ) 
0 - für w<0, w>1. 


b) Man bestimme die Momente E(W) und D2(W). 
ce) Man leite die Formel für k (w) her, wobei L, =? und ,= LM, , (k<n—1--1) ist. 
17. Es seien die Bedingungen des Satzes 10.11.2 erfüllt, und es sei n,=n, = m. Ferner 


bedeute C,„ die Anzahl der Punkte x, für die Sm (25) Z Syn (&, + 0) gilt. Man zeige, 
daß dann (CuungG und FeLLer [1], GNEDENKO und MIcHALEwITScH [1}) 


P(i„n„=b= 
ist. 
Hinweis. Man wende ähnliche Überlegungen an wie beim Beweis des Lemmas in 10.11. 


18. Es seien die Bedingungen des Satzes 10.11.2 erfüllt, und es sei nn, =", = m. Ferner 
seien %, < Yg << Y,, die in aufsteigender Reihenfolge geordneten Werte der beiden 
Stichproben. Dann konvergiert die Wahrscheinlichkeit dafür, daß für alle zwischen 
Y,, und y,, eingeschlossenen x-Werte die Ungleichung $8,„(2)< 83, (x) gilt, für m —> oo 


gegen 


1 R (1 —P) % ki & k, 
— aresin || ——— x — lim ‚„ ß= lim . 
Ku Bi —o) m->00 2m mo 2m 
Das ist die Arcussinusregel (Levy [7], Erpös und Kac [2], GNEDENKO [7], GIcH#mas [1)). 


19. Es sei (x, %, ...,%,) eine einfache Stichprobe aus einer Gesamtheit, in der F(ie)=x 
((<x=1) ist, und es seien %, < ya <---< y,„ die geordneten Werte von x. Ferner sei 
y* der Wert y,, für den D; = sup[8„(x) — x] .den maximalen Wert annimmt, und A# 
bezeichne den Index k für y,= y*. Y* und K* seien Zufallsvariable, deren mögliche 
Werte y* bzw. k* sind. Man beweise die folgenden Behauptungen (Birysavn und PrkeE 
[1]; siehe auch Kviper [1]): 


a) Y* ist im Intervall [0, 1] gleichverteilt. 


n—1 1 a\ , . ; 
b)P(K*=k)=-n"t 5 | ) ln — ir-iml, 
i 


int 1 


c) Wie kann man dieses Ergebnis formulieren, wenn F(x) eine beliebige stetige Ver- 
teilungsfunktion ist? 


20. Es seien 8,,(%), Sz„(x) und Sy3,(x) empirische Verteilungsfunktionen einfacher Stich- 
proben aus einer Gesamtheit, in der X eine stetige Verteilungsfunktion hat. Man zeige, 
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daß dann die folgende Beziehung für jedes A > 0 gilt (Ozors [1]): 
im P(Yn/2 max[S1n() — S2ne)] < A, Ym/2 max [8,n(2) — Sgn(@)] < 7) 
z E2 


>09 


= 1 exp (—222) + 2exp (—64°) — exp (—822). 


Hinweis. Man stelle ähnliche Überlegungen an wie im Beweis des Lemmas in 10.11.C. 


21. Man finde zwei verschiedene Koeffizientensysteme B;„, die die Beziehungen (10.13.6) 
bis (10.13.8) erfüllen. 


22. (Bezeichnungen von 10.12.) Man beweise die Gültigkeit der Beziehung 


R e j 0 für A<0, 
lim P (1 sup Se ed < ) = ji 
" n—00 0SF(e)sı F@) 177 für A >0. 


(Dieser Satz wurde erstmalig von Danısus [2] bewiesen; später wurde er unabhängig 
voneinander von HANNAN, ROBBINS, CHAPMAN und DEMPSTER entdeckt. In der Arbeit 
von DEMPSTER [1] ist der Beweis angegeben.) 


11. ABRISS DERITERATIONSTHEORIE 


11.1. Einleitende Bemerkungen 


Die Iterationstheorie erlaubt, aus der Reihenfolge, in der die einzelnen Stich- 
probenelemente auftreten, Schlüsse zu ziehen. Befinden sich zum Beispiel in 
einer Stichprobe fehlerlose und fehlerhafte Stücke, so haben alle bis jetzt an- 
gegebenen Stichprobenfunktionen nur die Anzahl der fehlerlosen bzw. fehlerhaften 
Stichprobenelemente berücksichtigt, während die Reihenfolge ihres Auftretens. 
nicht beachtet wurde. Dagegen berücksichtigt die Iterationstheorie die Reihen- 
folge, in der die einzelnen Stichprobenelemente auftreten, und erlaubt deshalb, die 
Information, die uns die Stichprobe vermittelt, besser auszunutzen. 


11.2. Definition der Iterationen 


EsseienX,j =1,2,..., n) unabhängige Zufallsvariable mit derselben Zweipunkt- 
verteilung: 


PX, =a)=P,. PX, =a)=1-—». 


Wir betrachten eine Stichprobe (x, x ..., %,). Jede Stichprobe besteht hier aus 
Elementen a, und a,, die sich wiederholen können und in einer bestimmten 
Reihenfolge auftreten. 


Definition 11.2.1. Die Folge (©;, 2.3 %j41), bei welcher j=1,2,...,n und 
i=0,1,...,n —j sein kann, wird eine Iteration genannt, wenn 


%_ı = % ET j+l 7 %rlr41 (11.2.1) 


ist. Die Zahl 2 + 1 nennt man die Länge der Iteration. 

Für j=1 ist „es, =“ auf derlinken Seite von (11.2.1) überflüssig, während 
»# Zum“ für 5j+=n auf der rechten Seite von (11.2.1) überflüssig ist. 
Mit X,, wollen wir die Anzahl aller derjenigen Iterationen bezeichnen, die in 
einer Stichprobe vorkommen, die Länge j haben und nur aus «a, bestehen, wobei 
°=1 oder 2 ist. Unter N; ( =1,2) verstehen wir die Anzahl aller «,;, die in.der. 
Stichprobe vorkommen. Es ist also N, + N,=n. Hier gelten die Formeln 


= 


NjKy=N,; G=12. _ . (11.2.2) 
: 


31* 


a 
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Endlich verstehen wir unter X, (? = 1,2) die Anzahl aller derjenigen Iterationen, 
die nur aus Gliedern «a; bestehen, während mit K die Gesamtanzahl aller Itera- 
tionen bezeichnet sei. Dann ist 


K,= IK, (=12), (11.2.3) 
1 


K=K,+R&,. 
Beispiel 11.2.1. Wir betrachten die Stichprobe 
4,,04,09, 09,09, 49,y41,41,41.4,Ay,dg. 


Hier haben wir eine a,-Iteration der Länge 1, eine a,-Iteration der Länge 1, eine a,-Iteration 
der Länge 2, zwei a,-Iterationen der Länge 3 und endlich eine a,-Iteration der Länge 4. 
Für diese Stichprobe sind die beobachteten Werte %,, der Zufallsvariablen X,; gleich 


kr kogı kız kg l, ham 2. 


Weiter gilt n, = n, = 7. Die beobachteten Werte k,, k, und %k der Zufallsvariablen X,, Ka 
und K betragen 


11.3. Die Verteilungen der Iterationsanzahlen 


A. Unsere Aufgabe besteht nun darin, die Verteilungen der oben eingeführten 
Zufallsvariablen zu finden. Zunächst bemerken wir, daß K, und K, sich höchstens 
um eine Einheit voneinander unterscheiden können; denn es sind für die be- 
obachteten Werte. der Zufallsvariablen X, und X, nur die folgenden drei Fälle 
möglich: 


1.kı=k,, 2.k=k, +1, 3.kh=k,-1. 
Wir führen die Funktion 6 (k,, k,) ein, die folgendermaßen definiert sei: 


0 fü | —kol>1, 
G(k,k) = !1 für | — klei, (11.3.1) 
2 fü =h,.. 


Die Funktion @(k,,%,) gibt uns an, auf wieviel verschiedene Arten man &k, 
Iterationen von a, allein und %k, Iterationen von a, allein erhalten kann. Man 
kann nämlich für k, =k, auf zweierlei Arten &, Iterationen von a, und &, 
Iterationen von a, erhalten, während für k, =k, (also für |k,—k|=1) 
man nur auf eine einzige Art diese Iterationen erhalten kann. 
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Wir bezeichnen mit P(ky; ka, %,";) die Wahrscheinlichkeitsfunktion der 
Zufallsvariablen 


(Kane Kin Kay en Kon Na No). 

Es silt: 

P (kiz kaj, %1, 02) (11.3.2) 
= P(Ky=kın.:-, Kın, = kin Ku = kan...» Kon, = kan N =, N =n) 


= P(K. = kin ---» Km, = Kin, Kaı = har: ---» Kan, — kan, | Nr =Nı, N, =) 
xP(N, =n, N =n). 


Aus der Unabhängigkeit der Zufallsvariablen X, und daraus, daß ihre Verteilung 
dieselbe ist, folgt: Für gegebene n, und n, ist jede Reihenfolge der Glieder a, und 
@, gleichwahrscheinlich. Weiterbemerken wir, daß man die k; # =1, 2) Iterationen 
der Glieder a,, wobei k;, Iterationen die Länge 1, %,, Iterationen die Länge 2,..., 
kn, Iterationen die Länge n; haben, auf 


k;! 
ku! ka! 
verschiedene Arten anordnen kann. Berücksichtigen wir noch die Definition der 
Funktion @(k,,k,), dann finden wir, daß wir k, aus Gliedern a, bestehende 
Iterationen, wobei %,, Iterationen die Länge 1,..., k,,, die Länge n, haben, 
sowie %k, Iterationen, gebildet aus Gliedern a,, wobei k,, Iterationen die Länge 


., Kg, die Länge n, haben, auf 


k! hy! 
hyler- Kgm Apıl sr Ay! 


2ne 


G(kı, ke) 


verschiedene Arten anordnen können. Da man die n Glieder, unter denen sich n,. 
Glieder a, undn, —=n — n, Glieder a, befinden, auf verschiedene Arten erhal- 


N, 
ten kann, ist die bedingte Wahrscheinlichkeit, die auf der rechten Seite der For- 
mel (11.3.2) vorkommt, gleich 


k,! k,! Gl 2) Zul! _ 
Kyle kan! Kgı! Kon, ! 


Berücksichtigen wir schließlich noch 


P(N =n,N =n)= pr (1 — pP)", 


ES 
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so erhalten wir endgültig 


Pk; Rap N, N;) a 


ku! kn! R,! kon, ! 


B. Wir wollen jetzt die Randwahrscheinlichkeitsfunktionen Pin N,,N,) der 
Zufallsvariablen (X, ..., Kın,, Ni, Na) bestimmen. 

Diese‘ Bestimmung führen wir in zwei Schritten durch. Zuerst wollen wir die 
Wahrscheinlichkeitsfunktion P (k,;, kg, %,, 25) der Zufallsvariablen (K,, ..., Kın,, 
Ka N, N.) und dann die gesuchte Wahrscheinlichkeitsfunktion finden. 

Wir berechnen für feste n, und k, den Ausdruck 


k,! 

2 Black (11.3.4) 
wobei sich die Summation über diejenigen ky,..., kan, erstreckt, welche den 
Relationen 

2 he zur Sky =k, 
genügen. Es gilt nun die Identität 
++ fear tatar rt. ER ah tm! m 


(1 — a)" no (kg, — 1)!m! 


Wir vergleichen die Koeffizienten von x”: auf der rechten und der linken Seite 
dieser Identität. Auf der rechten Seite ist dieser Koeffizient gleich 


N, —1 % 
es _ } (11.3.5) 


während er auf der linken Seite gleich (11.3.4) ist. Aus den Formeln (11.3.3) bis 
(11.3.5) ergibt sich 


h,! k,! 
1 G(ky, ko)p" (1 — pP)" 3 > 


Pi; nn 
( 1 Naj> Rı ”,) kn! ER hy, ! an) 


Ku! Ng 
NE G(k,, k, 1-— p)"*. (11.3.6 
er eo) (by, k)p® (1 — pP)". (11.3.6) 


Um die gesuchte Funktion P(k,,n%,,%s) zu erhalten, summieren wir (11.3.6) 
bezüglich k,. Wenn wir die Beziehung zwischen K, und K, und die Definition der 


11.3. Die Verteilungen der Iterationsanzahlen i 487 


Funktion @(k,, k,) beachten, erhalten wir 


m Gh) 
tt 
m BED m) 


2 u 
= (Mg, N (na TE 


1 f[e+R 
en | k, ) 


Dies und die Formel (11.3.6) ergibt 
P(k,; N, 2) R 
k,! = @(k,, k,) 


u I ef mi By ee el 
Fer De 2, (eg — U)! ln — Aa)! 
ky! N, t+1\ , 
BESEHERE. : CERRE (1 p)®. 11.3.7 
| = or p) ( ) 


Einen ähnlichen Ausdruck erhält man für die Wahrscheinliehleitefünktion 
P (ko; ?,, No). 


€. Große Bedeutung für die Anwendungen besitzt die Wahrscheinlichkeitsfunktion 
Pik,, kg, %ı,%e) der Zufallsvariablen (K,, K,,N, N;). Um diese Funktion zu 
finden, summieren wir (11.3.6) bezüglich k,,, und zwar genauso, wie wir es in 
(11.3.3) taten, um (11.3.6) herzuleiten. Wenn wir also beachten, daß die Aus- 
drücke (11.3.4) und (11.3.5), in denen wir vorher %,, 2, und k,, durch k,, rn, und k,; 
ersetzt haben, einander gleich sind, so führt die Formel (11.3.6) zu 


nn —1i\/m —1 
Pk kam) = (1 I ) Gl kant - pi“. (11.3.8) 
1 2 ı 2 Kk—1 k,—1 ı 2 


Aus der letzten Formel finden wir leicht durch Summation über k, bzw. k, 


die Wahrscheinlichkeitsfunktionen P(k,%,n,) und P(k,,n,,n,) der Zufalls- 
variablen (K,, N,, N) bzw. (K,, N,, N). Wir erhalten nämlich 


2 1\ m +1 
Pin) = (} )(” Jar pr, 
BEIELGEELT) ki kı 


1 —41 
Pi", In _.)Prü- pr. (11.3.9) 
2 27 


D. Schließlich wollen wir die Wahrscheinlichkeitsfunktion der Gesamtiterations- 
anzahl, d.h. der Zufallsvariablen X = K, + K, bestimmen. Hier unterscheiden 
wir zwei Fälle: 
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a) k ist eine gerade Zahl; dann muß kl, =k, - sein. Aus Formel (11.3.8) 


ergibt sich, wenn wir @ (2 3) = 2 berücksichtigen, 


k k nn, —-1\ [oa 1 
P(K=k)= (2 rm) = 2 fa . pl — P)”; 
en | 
2 \e2 (11.310) 


EN — 


b) % ist eine ungerade Zahl; dann ist entweder k, = 


k— 1 
oder k, = Fa und k, = . Da für diesen Fall @(k,, k) =1 ist, 
erhalten wir aus Formel (11.3.8) 
k+1k-—1 k—1k-+1 
j PiK=b=P( 93 ’ P m) + RE 5- P > 9% nn) 
n,—ı\ /w —1 nn —-ı\ /m—1 . 
E— ı(1 — p}R:, 
Ball 28) (a-3)[a-a) a 
Pz 9% 9% 2 (11.3.10°) 


Aus (11.3.9) und (11.3.10) kann man die bedingten Wahrscheinlichkeitsfunk- 
tionen der dort auftretenden Zufallsvariablen K unter den Bedingungen N, = n, 


und N,=n, bestimmen. Wir haben nämlich 
N, — El) + J 


| Mi 4 
P(K, =k|N=n,N=n)= 


n, + ii I — ı) 
\ ke ai) (11.3.11) 


P(R,=k|N =n,N,=n,) _| 


Ähnlich haben wir für gerade bzw. ungerade k 


PK=kIN =n,N,=n)=2 
x 
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P(K=Kk!N, =n,N, =n,) 


n,—-1\ /%—1 n—I1\ /n—1 
k—1 k—3 "k—3 k—1 

2 

FEN = 2 (11.3.12) 
n n 
1 ( 

Swen und EISENHART [1] arbeiteten für n, und n,, beide Werte kleiner als 
21, Tafeln aus, die die Werte der Funktion P(K<k|N, =n,N,=n,) an- 
geben. 


Die oben angegebenen Ergebnisse aus dem Gebiet der Iterationstheorie stam- 
men von BORTKIEW1CZ [2], Moop [1], STEvEns [i] u. a. 


Beispiel 11.3.1. Essei P(X,;,=a,) = P(X,;=a,)=0,5. In einer einfachen Stichprobe 
vom Umfang n = 8 befindensich n, = 5 Gliedera, undn, = 3 Glieder «,, die folgender- 
maßen angeordnet sind: 


0,4104, 09,01,94g- 


Es gilt hier 


kyamkuml kIemkamks=t, kyalkgel, ig=0, 
k=kh=2, k=4 m=5, mM=3, n=8. 


Wie wir berechnen, ist P(N, =5, N, = 3) = 0,2234. Weiter berechnen wir aus der Formel 
(11.3.3) die Wahrscheinlichkeit einer Gruppierung der Glieder a, und a,, für die die Zufalls- 
variablen K,;, Ka;, N, und N, die in diesem Beispiel beobachteten Werte annehmen. Diese 
Wahrscheinlichkeit beträgt 0,0319. Aus dem Kolmogoroffschen Gesetz der großen Zahlen 
folgt: Wenn wir mehrmals unabhängige einfache Stichproben zu 8 Elementen erheben, so 
erhalten wir in ungefähr 22 von 100 Fällen Stichproben mit 5 Gliedern «a, und 3 Gliedern a. 
Dagegen enthalten nur ungefähr 3 von 100 Stichproben die von uns beobachteten Iterations- 
anzahlen. 
Auf dieses Beispiel werden wir noch in 14.2 zurückkommen. 


E. Ohne Beweis wollen wir noch zwei Ergebnisse angeben, die die Grenzver- 
teilungen von Iterationen betreffen. WisHART und HIRSCHFELD [1] bewiesen, 
daß die Zufallsvariable X, deren Verteilung durch die Formeln (11.3.10) und 
(11.3.10’) bestimmt ist, für n — oo asymptotisch normal 


N(2npg; 2Ynpg(i — 3p9)) 


verteilt ist. WALD und WoLFowITz [2] bewiesen, daß die durch (11.3.12) gegebene 
bedingte Verteilung für n, =an, (« >0) und n, — oo asymptotisch normal 


v( 2nı ; 4an, 
Ir& (ta) 
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verteilt ist. Die letzte asymptotische Verteilung kann man schon für n, > 20 
und 7, > 20 benutzen. 

Man kann auch Iterationen betrachten, die sich aus mehr als zwei Elementen 
zusammensetzen. Viele Ergebnisse auf diesem Gebiet findet der Leser in der 
Arbeit von Moop [1]. 

Des weiteren kann man noch allgemeinere Iterationen betrachten, und zwar 
solche, bei denen die Zufallsvariablen X, (siehe den Anfang von 11.2) unabhängig 
sind, jedoch eine homogene Markoffsche Kette bilden. Gewisse Ergebnisse auf 
diesem Gebiet findet man z. B. in der Arbeit von BABKINn, BELJAJEw und MAxI- 
Mow [i]. 


11.4. Mittelwerte und Dispersionen der Iterationsanzahlen 


An dieser Stelle wollen wir Mittelwerte und Dispersionen für einige der in 11.3 
betrachteten Zufallsvariablen berechnen. 
Aus (11.3.11) ergibt sich 


len 
" k—1 k 
EKN =n,N=-n)=% k 1 " 


= | : ) 
i N, 


E _ ı) | Na 
— (N, + yy \ht\hoi) (11.4.1) 


z () 
N, 


Wir betrachten die Identität 


1 nl 1 Nıtne-1 


zrım1 


Entwickeln wir beide Seiten dieser Identität nach der binomischen Formel und 
betrachten wir die konstanten Glieder auf beiden Seiten, so haben wir auf der . 
rechten Seite 


n+m—1i 
a N 


während auf der linken Seite 


g n—1 N 
Ba 1) —1 


steht. 
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Dies und (11.4.1) führen auf die Beziehung 


E(K, |Nı ze N, + +1) (nn —1)! (+1) N, 


(rn, — 1)! ne! _ n j 
(x ) (11.4.2) 


Vertauschen wir in dieser Formel die Rollen von n, und n, miteinander, so er- 
halten wir 


E(R N, =n,N,=n) = 


(11.4.3) 


Aus den beiden letzten Gleichungen folgt 
E(K|N, =n,N,=n,) 
=E(K IN, =, =n)+E(R IN =n,N,=n,) 


Semmen - (11.4.4) 
N 


Um die bedingte Dispersion 
DM(K,|\N, =n, Na = ns) 
zu finden, berechnen wir zuerst 
B(K,(K, 1 =n,N, =n). 
Aus Formel (11.3.11) ergibt sich 


s =) =) 
B(K,(K, DIN =n,N =n)=n(m +1) > = i 
Ih=i NR 
12) (11.4.5) 


Wenn wir beide Seiten der Identität 


arg) 
x 


grı-1 


nach der binomischen Formel entwickeln und die Koeffizienten von x! mitein- 
ander vergleichen, so erhalten wir 


B> rn, —1\/%-—1 = N + Ng— 2 
za -1/\ı —2 u 
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Diese Formel und (11.4.5) führen zu 


nt+m—2 
nn ?) 
DRK, — NN, = Na =) = 
(2) 

Aus der letzten Formel und aus (11.4.2) ergibt sich 

D&(K,|N, =n, N, =n,) Am - Yan rl) (11.4.6) 

(n — 1)n? 

Ähnlich erhalten wir 

DARK, N, =n, N, =n) = nn + Yan — 1) (11.4.7) 

(n — 1)n? 


Die Formel . 
NN, (NN. — nn) 


DM(K|N, =n,N,=n) = Gern 


(11.4.8) 


geben wir ohne Beweis an, denn die zu ihr führenden elementaren Rechnungen sind 
etwas umständlich. 


Aus (3.6.24), (11.4.2) und (11.4.6) ergibt sich 


E(K,)=E 2] =znpi—-P+P, 


D’(K)=npll — 4p + 6p* — 3p°) + P(8 — 8p + 5PP). 
Analog haben wir 

ER)=nti—N+g, 

D(R)=ngll —49 +69 — 30) +8 — 84 + 59), 


wobei g=1—p ist. 
Die Kovarianz u,, der Zufallsvariablen X, und K, ist durch die Formel (siehe 
Moop [1]) 


Au = — npqg(3pg — 1) — pg(2 — 5pg) 


gegeben. 
Weiter gilt 


E(K)=E(R,+K)=p®-+g? + 2npg, 
D®(K) = D°(K,) + DU(K,) + 2 
= 4npg(1 — ?og) — 2pg(3 — 1029). (11.4.9) 
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Insbesondere haben wir für y=q= e 


BR) =", 
D2(K) — . 1 (11.4.10) 


B. Zum Abschluß dieses Kapitels wollen wir den Leser darüber informieren, daß 
die Iterationstheorie bereits in den frühen Jahren der Entwicklung der modernen 
Wahrscheinlichkeitsrechnung die Aufmerksamkeit vieler Autoren auf sich ge- 
lenkt hat. Besonders wichtig auf diesem Gebiet ist das Buch von Bortkızwıcz [2], 
und zwar sowohl wegen der dort enthaltenen Formeln als auch wegen der Dis- 
kussion mit MARBe [1] über dessen Versuch, die Anwendbarkeit der Wahrschein- 
lichkeitsrechnung durch Interpretation gewisser beobachteter Iterationen zu 
fördern. An dieser lebhaften Diskussion beteiligten sich Czuser [1], von Mıses [2], 
Lexıs [1] und Fryoe [1]. 


11.5. Aufgaben und Ergänzungen 


In den Aufgaben 1 und 2 sind die gleichen Überlegungen anzustellen wie bei der Herlei- 
tung der Formeln in 11.4. j 


1. Man zeige, daß die Gleichungen 


(2 + NO mi) 
nGd+D 


E(KyINı = m N,=n,)= 


(m +1 nd 
E(Ky, IN, = N=n,= nirD 


gelten, wobei a® = a(a — 1). - (a —1-+1) ist. 


2. Man beweise für m,j=1,2,...,n, und s=1,2,...,n, die Gleichungen 


nn, + Inn ln, + 1) n{P]2 
D (Ky Idı n, N,=n) na) | nG+D ’ 


nn, 112) „ur N DE HD nm 
60V (Kyz Kım) = (9%; +1) 1 Er: + 1)@] I A| 


nÜtm-+2) nötD nim+D) 
(+2) „(s+2) G+1D „(s+1 
cov (K,, Ks) = Se: 1 m 
Uzunte nor) | nG+s+1) 


RD + (m, + nd ne 
TO ni+s) nG+D net) " 
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3. Man beweise: Ist n, = &n, (x > 0) undstrebt n, —co, so ist die Grenzverteilung eines 
beliebigen Zufallsvektors (Kr, +-., Kızw Ras ---, Kas,) asymptotisch normal und hat 
die in den Aufgaben 1 und 2 angegebenen en Varianzen und Kovarianzen 
(Moon [1}). 

Hinweis. Man leite zunächst aus der Formel (11.3.3) die Wahrscheinlichkeitsfunktion 
Pkiz Kap Ru Re Ni = Rs N,=n,) her. Sodann betrachte man die standardisierten 


Zufallsvariablen (Ku —E(K (K,)) YD*(K,) (K,;) und wende die Stirlingsche Formel an. 


4. Wir bezeichnen mit R,, die Anzahl der a,-Iterationen der Länge >j (=1,2; 
j=1,2,....,n;) und a R;=Rı;+ Re; die allgemeine Anzahl der Iterationen der 
Länge >; j. : 


a) Man bestimme die Wahrscheinlichkeitsfunktionen dieser Zufallsvariablen. 


b) Man beweise die Beziehungen 


nn, +1) 

ER, |dı = ru, N =) = . un (=12,. ‚Rı)> 
nn, +1) 

ER, |Nı = NR, Na = n,) = 2 a G=1,2,. Rs) 


5. Manbeweise, daßfür an, = n, = 5 n die folgenden Beziehungen gelten: 


: 1 n ’ 
a) BeRIN == GR) 8 gr G=1,2), 
1 n 2 
b)E a Sa (=1,2), 
1 n 
ER ze re 


12. SIGNIFIKANZTESTS 


‚22.1. Der Begriff eines statistischen Tests 


Jede Annahme über die unbekannte Verteilung einer Zufallsvariablen nennen wir 
eine statistische Hypothese. Wir wollen einige Beispiele für derartige Bee 
bringen. 

In Beispiel 12.1.1 legt die Hypothese nur den Wert eines mäbäksnnten Ver- 
teilungsparameters einer Zufallsvariablen fest, von der wir wissen, daß sie normal 
verteilt ist. 

Eine statistische Hypothese, die nur die Werte unbekannter Zahlenparameter 
einer Zufallsvariablen festlegt, nennt man eine Parameterhypothese. 

Methoden, die zur Nachprüfung oder, wie man auch oft’ sagt, zur Verifikation der 
aufgestellten Hypothese 7, dienen, nennt man statistische T’ests. Einen Test, der 
zur Nachprüfung einer Parameterhypothese dient, nennt man einen Parameteritest. 

Stellen wir eine einzige Hypothese auf und dient der betrachtete Test nur dazu, 
nachzuprüfen, ob diese Hypothese nicht falsch ist, während gleichzeitig keine 
anderen Hypothesen untersucht werden, so spricht man von einem Signifikanztest. 
In diesem Kapitel wollen wir uns mit.den Signifikanztests beschäftigen und an 
Beispielen zeigen, wie man statistische Hypothesen testet. 

Beispiel’ 12.1.1. Das Merkmal X sei in einer gewissen Grundgesamtheit normal N (m; 1) 
verteilt, der Mittelwert m sei unbekannt. Wir nehmen nun an, daß m = 0 gilt, mit anderen 
Worten, wir stellen eine statistische Hypothese auf, die wir r mit H, bezeichnen und in der 
Form H,(m = 0) schreiben wollen. 

Angenommen, die Hypothese H,(m = 0) sei richtig. Der betrachteten Gesamtheit ent- 
nehmen wir eine einfache Stichprobe vom Umfang 10, die den Mittelwert #5 = 1,01 besitze. 
Dieser Wert stellt den beobachteten Wert % der Stichprobenfunktion X dar. Die Verteilung 
der Zufallsvariablen X in einfachen Stichproben aus einer normalen N(0;1) Gesamtheit 
ist uns genau bekannt. Nach Formel (9.3.5) ist in unserer Stichprobe die Variable X normal 


1 
N ( ; o.) verteilt. Die Wahrscheinlichkeit dafür, einen Wert zu erhalten, der absolut ge- 
10 
nommen größer oder gleich dem beobachteten © = 1,01 wäre, beträgt 
P(|X| 2 1,01) = P(|X| Yıo > 1,01 Y10) » 2[1 — ©(3,05)] » 2(1 — 0,999) 
== 0,002. 


Ist also die Hypothese H,(m = 0) richtig, so kommt das beobachtete Ereignis in der 
Praxis äußerst selten vor; denn die Wahrscheinlichkeit dieses Ereignisses beträgt 0,002, 
d.h., in ungefähr 2 von 1000 Fällen würden. wir einen Mittelwert £ beobachten, dessen 
Absolutbetrag größer oder gleich 1,01 ist. 
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Danach ergibt sich folgende Frage: Können wir jetzt, da’die Wahrscheinlichkeit 
des Ereignisses [X] > 1,01 sehr klein ist, als bewiesen annehmen, daß die Hypo- 
these H, falsch ist? Wir müssen verneinen; denn ist auch die Wahrscheinlichkeit 
des Ereignisses |X| > 1,01 unter der Annahme, daß die Hypothese H, richtig 
ist, sehr klein, so kann doch ein derartiges Ereignis eintreten, wenn sich höchst 
selten. 

Der Statistiker muß hier aber eine Entscheidung treffen, d. h., er muß sich für 
Annahme oder Ablehnung der Hypothese H, entscheiden. Dies tut er dadurch, 
daß er eine kritische Wahrscheinlichkeit « vorgibt und dann, wenn die Wahr- 
scheinlichkeit des beobachteten Ereignisses (die Hypothese H, als richtig an- 
genommen) kleiner oder gleich « ist, die Hypothese ablehnt. 

Die so bestimmte kritische Wahrscheinlichkeit nennt man auch Sicherheits- 
wahrscheinlichkeit. Die kritische Wahrscheinlichkeit & kann für ‚verschiedene 
Probleme verschieden sein; sie ist im allgemeinen durch Konvention festgelegt. 
Gewöhnlich nimmt man «& = 0,05 oder 0,01. Wählen wir aber x = 0,01 (um so 
mehr also, wenn wir & = 0,05 wählen), so müssen wir im Beispiel 12.1.1. die 
Hypothese H,(m = 0) ablehnen. 


Beispiel 12.1.2. Einer normalen N(m;1) Gesamtheit, deren Mittelwert unbekannt 
ist, entnehmen wir eine einfache Stichprobe vom Umfang r» = 16. Diese Stichprobe ergebe 
den Wert &= 0,1. Wir wollen die Hypothese H,(m = 0) prüfen. 


= 1 
Ist die Hypothese H, richtig, so hat die Zufallsvariable X eine Normalverteilung N (0 z) 
Wir berechnen die Wahrscheinlichkeit 4 


P(X| 20,1) = P(4|X| > 0,4) = 211 — 004)] = 2. 0,345 = 0,690. 


Die Wahrscheinlichkeit dafür, einen absolut genommen größeren oder gleichen Wert als 
den beobachteten zu erhalten, ist hier viel größer als « = 0,01. Daraus folgt aber noch nicht, 
daß man die Hypothese HZ, ohne Vorbehalt als richtig betrachten kann. 


Ein Signifikanztest erlaubt im allgemeinen nur, in einer Richtung zu entscheiden: 
Ist unter der Voraussetzung, daß die Hypothese H, richtig ist, die Wahrschein- 
lichkeit des beobachteten Ereignisses kleiner oder gleich &, so kann man die 
Hypothese H, ablehnen. Ist jedoch die Wahrscheinlichkeit des beobachteten 
Ereignisses größer als «, so kann man nur sagen, daß das Ergebnis de® durchge- 
führten Versuchs nicht im Widerspruch zur Hypothese H, steht. Die Annahme 
einer Hypothese 77, auf Grund eines einzigen Versuchs, dessen positiver Ausgang 
im Fall der Richtigkeit der Hypothese 7, höchstens häufiger als einmal oder fünf- 
mal in 100 Versuchen gewährleistet ist, ist weder durch die Wahrscheinlichkeits- 
rechnung begründet noch vernünftig. Wir heben diesen Umstand deshalb beson- 
ders hervor, weil manche Praktiker häufig den grundsätzlichen Fehler 
machen, die Hypothese als richtig zu betrachten, wenn der Signifikanztest die 
Hypothese nicht ablehnt. 

Man kann jedoch statistische Testmethoden konstruieren, die es erlauben, 
Hypothesen zu bestätigen. Wir wollen sie in Kapitel 16 behandeln. 


12.2. Parametertests für kleine Stichproben 497 


12.2. _ Parametertests für kleine Stichproben 


Aus den Betrachtungen in 12.1 folgt, daß man das Wesen eines Parameters fol- 
gendermaßen charakterisieren kann: 

Unbekannt sei der Verteilungsparameter Q eines Merkmals der Elemente 
einer Grundgesamtheit, während die Gestalt der Verteilungsfunktion bekannt sei. 
Wir stellen die Hypothese 4,(Q@ =Q,) auf. Der untersuchten Gesamtheit ent- 
nehmen wir eine n Elemente zählende Stichprobe und bestimmen aus ihr den 
beobachteten Wert u der Stichprobenfunktion U. Dann setzen wir eine kritische 
Wabrscheinlichkeit & fest, wobei & eine kleine Zahl ist, gewöhnlich 0,01 oder 
0,05. Nun nehmen wir einen solchen Wert u, der Stichprobenfunktion U, daß unter 
Annahme der Gültigkeit von H, die Beziehung P(|U]>u,)<x« gilt. Erfüllt 
der beobachtete Wert u die Ungleichung |«| > “,, so lehnen wir die Hypothese 
H, ab. Wir stehen nämlich auf dem Standpunkt, daß der beobachtete Wert |w| 
zu groß ist, als daß man sein Auftreten bei Gültigkeit von HZ, durch zufällige 
Schwankungen erklären könnte. 

In einigen Problemen ist der Wert u, sozu wählen, daß P(|U|> u) <x oder 
P(IT|<w)<S« ist. Darüber, wie u, zu wählen ist, entscheidet der Charakter 
des betrachteten Problems. Eine ins Einzelne gehende Besprechung dieser Fragen 
findet der Leser in Kapitel 16. 

Wie wir sehen, ist es äußerst wichtig, die Verteilung der Stichprobenfunktion U 
oder wenigstens den Wert u, zu kennen. 

Bei der Durchführung eines Signifikanztests gehen wir verschieden vor, je 
nachdem, ob kleine oder große Stichproben vorliegen. Im ersten Fall benutzen 
wir die exakten Verteilungen der Stichprobenfunktionen und im zweiten die ent- 
sprechenden Grenzverteilungen. 


Beispiel 12.2.1. STUDENT [1] gab das folgende Beispiel an: Man untersucht die Wirk- 
samkeit der Schlafmittel A und B an 10 Patienten, die an Schlaflosigkeit leiden. Die zusätz- 
lichen Stunden an Schlaf, die ein Patient durch Einnehmen von A erlangt, seien mit X be- 
zeichnet, die durch Einnehmen von B mit Y. Wir untersuchen die Zufallsvariabe Z= X — Y. 
Die beobachteten Größen x — y dieser Variablen stammen aus einer einfachen Stichprobe 
vom Umfang 10; die beobachteten Werte der Zufallsvariablen X, Y, Z wurden in Tab. 12.2.1 
zusammengestellt. Man kann annehmen, daß die Zufallsvariable Z normal N (m; 0) verteilt 
ist. Wir stellen die Hypothese H,(m = 0) auf, ohne zu präzisieren, wie groß der Wert von 
o ist. 

Der Tabelle 12.2.1 entnehmen wir 2 = 1,58. Wir führen hier einen Signifikanztest für H, 
mit der Sicherheitswahrscheinlichkeit & = 0,01 durch. 

Hier ergibt sich die Frage, welehe Stichprobenfunktion als Testgrundlage dienen soll. 
Auf den ersten Blick scheint es, daß man für Stichproben aus einer Gesamtheit die Stich- 
probenfunktion Z benutzen könnte, wie es im Beispiel 12.1.2 möglich war. Dies geht jedoch 
deshalb nicht, weil unter Voraussetzung der Richtigkeit von H, die Zufallsvariable Z zwar 
normal N [0; ir verteilt, die Standardabweichung o aber. unbekannt ist. Die Stich- 

10 
probe ist hier zu klein, um für die Standardabweichung o den aus der Stichprobe berechneten 
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Tabelle 12.2.1. 


Patient | x | y | 2=c—y 

1 1,9 0,7 1,2 
2 0,8 —1,6 2,4 
3 1,1 —0,2 1,3 
4 0,1 —1,2 1,3 
5 —0,1 —0,1 0,0 
6 4,4 3,4 1,0 
7 5,5 3,7 1,8 a 
8 1,6 0,8 0,8 
9 4,6 0,0 4,6 

10 3,4 2,0 1,4 


Wert s = 1,167 annehmen zu können. Die Zufallsvariable $ konvergiert zwar stochastisch 
gegen o (siehe 9.11), aber ihr für » = 10 beobachteter Wert kann bedeutend von o abweichen. 
Deshalb wollen wir die Studentsche i-Verteilung benutzen. i 

Der in unserem Beispiel beobachtete Wert der Stichprobenfunktion t beträgt unter Versae- 
setzung der Richtigkeit der Hypothese H,(m = 0) 


2 .—— _ 1,580 ,— 
i „Ir 1= 77 1? = 406. 


Aus den Tafeln der Studentschen t-Verteilung bestimmen wir denjenigen Wert i,, für den 
die Beziehung P (|t]| =t,) = 0,01 gilt. Für 9 Freiheitsgrade finden wir t= 3,25. Derbeobachtete 
Wert t ist bedeutend größer als 2,, und deshalb lehnen wir die Hypothese H, ab. Das bedeutet, 
daß die Wirksamkeit der beiden Mittel nicht gleich ist. Das Schlafmittel A scheint wirksamer 
als das Mittel B zu sein. 


Beispiel 12.2.2. In einer Fabrik produziert man Serien von Massenartikeln, deren 
Merkmal X normal N (m; c) verteilt sei; die Standardabweichung o sei unbekannt. Unterliegt 
der Produktionsprozeß keinen wesentlichen Störungen, so bleibt die Standardabweichung 
o für alle Serien dieselbe. Aus diesem Grunde stellt o ein Maß für die Homogenität der Pro- 
duktion oder für die Übereinstimmung des untersuchten Produktionsprozesses mit den 

‚ technischen Normen dar. 

Wir entnehmen einer Serie von Massenartikeln Stichproben und berechnen die Standard- 
abweichung des x-Wertes in den Stichproben. 

Wir wollen die Hypothese H,(o=4) mit der Sicherheitswahrscheinlichkeit & = 0, 01 
testen. In einer einfachen Stichprobe vom Umfang 15, die dieser Gesamtheit entnommen 
wurde, erhielten wir nun den Wert s = 4,5. Wir fragen: Widerlegt dieser beobachtete Wert 
s unsere Hypothese? Muß man also annehmen, daß der beobachtete Wert s wesentlich größer 
als der mutmaßliche Wert o ist, oder läßt sich diese Abweichung durch zufällige Schwankungen 
erklären, vorausgesetzt, die Hypothese gilt? 

Hier benutzen wir die Verteilung der Stichprobenfunktion Z=nS?, deren Dichte durch 
die Formel (9.5.12) bestimmt ist; diese Formel gibt die Dichte der-g2-Verteilung mit n— 1 
Freiheitsgraden an. Wenn wir o =4 annehmen, erhalten wir den Wert 


z 15 - 4,5? 
= &19., 
. 0? 42 
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Aus den Tafeln der x?-Verteilung ersehen wir, daß für 14 Freiheitsgrade & = 0,01 die Wahr- 

scheinlichkeit der Ungleichung = = 29,1 darstellt. Der von uns beobachtete Wert 19 
c 

widerlegt bei der Wahrscheinlichkeit & = 0,01 die Hypothese Y, nicht. 


Beispiel 12.2.3. In einer Warenladung befinden sich fehlerlose und fehlerhafte Stücke, 
wobei der Ausschußkoeffizient » unbekannt sei. Wir stellen die Hypothese H,(p = 0,10) 
auf. Diese Hypothese besagt, daß die Ladung zu 10%, aus Ausschuß besteht. 

Wir entnehmen dieser Ladung eine einfache Stichprobe vom Umfang rn = 30. Dem Auf- 
treten eines fehlerhaften Stückes ordnen wir die Zahl 1, dem Auftreten eines fehlerlosen 
Stückes die Zahl 0 zu. Man fand nun in der Stichprobe 4 Ausschußstücke. Widerlegt diese 
Probenuntersuchung die Hypothese H, bei Vorgabe einer Sicherheitswahrscheinlichkeit von 
& = 0,05? 

Wir wollen die binomial verteilte Stichprobenfunktion- 


30 
ee 
k=1 


untersuchen, wobei X, Zufallsvariable mit derselben Null-Eins-Verteilung sind. Ist die 
Hypothese H, richtig, so ist die Wahrscheinlichkeitsfunktion dieser Zufallsvariablen durch 


30 
P&X=r) -( Jar (r = 0,1, ...., 30) 
r 
bestimmt. Daraus folgt 
30 /30 
PX 24 = >. | ) 0,17 » 0,9307, (12.2.1) 
s=4\T 


Um diese Summe zu bestimmen, berechnen wir nur 


P(X = 0) = 0,9®, 


30! 
PIX=1)= 5, 01.0,99 = 30: 0,1.0,9%, 
30! 
P(X =2)= ——__. 0,12. 0,9% = 15-29 - 0,12. 0,988, 
2128! 
30! 
P(X =3) = — —— 0,18.0,97 = 5-29: 28 - 0,19: 0,97. 
3127! : 


Die Sunime dieser vier Wahrscheinlichkeiten ist 
0,92770,98 -— 3 - 0,92 4- 4,35 - 0,9 + 4,06] = 0,927 . 11,134 > 0,6473. 


Somit ist die gesuchte Wahrscheinlichkeit gleich 1 — 0,6473 = 0,3527. Daraus ersenen 
wir, daß der hier angewandte Test die Hypothese A, nicht widerlegt. 


Beispiel 12.2.4. Die dem Buch von Boszw [1] entnommene Tabelle 12.2.2 enthält in 
ihrer Kopfzeile die Baumwollnummer X, die umgekehrt proportional dem in Zoll gemessenen 
Fadendurchmesser ist. In der ersten Spalte ist die Widerstandskraft Y des Fadens, gemessen 
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in Gramm, angegeben: Um die Widerstandskraft der Fäden zu prüfen, hat man 60 un- 
abhängige Probeuntersuchungen für verschiedene Fadennummern angestellt. Die Kästchen 
der Tafel enthalten die Anzahl der beobachteten Wertepaare (x, 4). 

Wir nehmen an, die Variable (X, Y) habe eine zweidimensionale Normalverteilung, und 
stellen die Hypothese H,(e = 0) auf; dabei bedeutet g den Korrelationskoeffizienten der 
Variablen X und Y. 

Wir wollen diese Hypothese an Hand der Ergebnisse, die wir aus der Probeuntersuchung 
erhielten, testen. So, wie die Zahlen in Tabelle 12.2.2 gruppiert sind, vermuten wir, daß 
der Test die Hypothese widerlegen wird. 


Tabelle 12.2.2. 


ni 4100 | 4300 | 4500 | 4700 | 4900 | 5100 | 5300 | 5500 | zusammen 
6,75 1 1 1 
6,25 2 2 1 6 
5,75 1 3 4 2 3 13 
5,25 3 5 7 1 1 17 
4,75 2 5 5 3 2 17 
4,25 1 2 2 5 
3,75 1 1 
zusammen 1 7 12 17 9 9 4 1 60 


Wir berechnen den beobachteten Wert r des Korrelationskoeffizienten R. Mit z und 7 
bezeichnen wir die beobachteten Werte von X bzw. Y. Es ergibt sich £ = 4746,67, y = 5,23. 
“Nun benutzen wir Tabelle 12.2.3, deren Kopf die Werte x — 5 enthält, während in der 
ersten Spalte die Werte y — Y eingetragen sind. Die einzelnen Kästen dieser Tabelle enthalten 
das Produkt (x — 2) (y — Y), multipliziert mit der Beobachtungszahl aus Tabelle 12.2.2. 
Wir erhalten 


„._Ze-De-N . 
„De-WIW— m 
Um die Hypothese H, nachzuprüfen, benutzen wir die Tatsache, daß für einfache Stich- 


proben vom Umfang » aus einer zweidimensionalen Gesamtheit mit o = 0 die Stichproben- 
funktion 


= —0,61. 


eine Studentsche i-Verteilung mit » — 2 Freiheitsgraden hat (vgl. 9.9). Der von uns beob- 
achtete Wert dieser Stichprobenfunktion beträgt —5,86. Die Studentsche Stichproben- 
funktion £ ist für 58 Freiheitsgrade angenähert normal N (0; 1) verteilt, die Wahrscheinlichkeit 
Pit) = 5,86) ist also äußerst klein. Wäre also die Hypothese H,(g = 0) richtig, so hätten 
wir ein äußerst seltenes Ereignis beobachtet, dessen Wahrscheinlichkeit viel kleiner als die 
von uns angenommene Sicherheitswahrscheinlichkeit « wäre. Daher lehnen wir die Hypothese 
H, ab. 
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Tabelle 12.2.3. 


© —& 
N 646,67 | 446,67 | -246,67 
v—% 
1,52 678,94 
1,02 |-659,60| -911,21 | -503,21 
0,52 232,27 | -348,81 
0,02 -26,80 | -24,67 
0,48 236,80 
0,98 
-1,48 


46,67 


47,60 
97,07 

6,53 
112,01 


153,33 | 353,33 | 553,33 


159,46 | 551,19 
3,07 7,07 


-367,99 | -508,80 | -531,20 
-150,26 | -692,53 | 1084,53 
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753,33 


-1114,93 


Beispiel 12.2.5. Die Tabelle 12.2.4 enthält die Kartoffel- und Eierpreise für den freien 
Handel, die im September 1947 in 14 polnischen Städten beobachtet wurden. Mit X bzw. Y 
seien die Kartoffel- bzw. Eierpreise bezeichnet. Aus den Angaben dieser Tabelle berechnen 
wir die Gleichung der Regressionsgeraden von Y nach X. 


Tabelle 12.2.4!) 


iR 1 kg Kartoffeln 
: Warschau 3 11,4 
Lödz 12,3 
Kielce 15,0 
Lublin 11,5 
Bialystok 5,0 
Olsztyn j 7,0 
Gdahsk 11,0 
Bydgoszez n 10,0 
Szezecin 10,5 
Poznan 2 10,5 
Wroclaw 12,3 
Katowice 11,8 
Kraköw 17,0 
Rzeszöw 12,0 


3) Quelle: Wiadomosei Statystyczne. 


Aus Tabelle 12.2.4 erhalten wir 


z=11,24, %=13,10, $= 7,71, 


Die Formel (9.10.1) ergibt 


3 = 1,01, 


.a=r 014, b=-J—- 02-114. 


5 


r=0,4. 


Freihandelspreis in Zloty im September 1947 für 


1Ei 


12,8 
15,0 
12,5 
13,5 
11,0 
12,5 
14,0 
12,0 
13,5 
14,3 
13,5 
13,5 
13,3 
12,0 
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Die gesuchte Regressionsgerade hat also die Form 
Y = 0,144X + 11,48. 


Wenn wir annehmen, daß (X, Y) normal verteilt ist, können wir einen auf die Formel (9.10.15) 
gestützten Signifikanztest anwenden, um festzustellen, ob die Hypothese HZ, gilt, daß der 
wirkliche Wert des Regressionskoeffizienten & gleich 0 ist. Wir haben 


LEE LE LEVeN 
 ayfı-r 1,005 Yoga A 


Da die Anzahl der Freiheitsgrade hier 12 beträgt, finden wir aus den Tafeln der Studentschen 
t-Verteilung, daß die Wahrscheinlichkeit dafür, einen nicht kleineren absoluten i-Wert 
als den beobachteten zu erhalten, größer als 0,05 ist. Es besteht also keine Notwendigkeit, 
die Hypothese HZ, aufzugeben. Dieses Ergebnis stimmt gut mit der Erfahrung überein, da 
Eier kein Ersatz für Kartöffeln sind. 


Beispiel 12.2.6. Wir wenden uns wieder dem Beispiel 12.2.1 zu. An jedem Patienten 
würde die Wirksamkeit zweier Schlafmittel ausprobiert, und wir betrachteten die Differenz 
x — y als eine einzige Beobachtung an einem Patienten. Nun stellen wir uns vor, daß der 
Versuch anders durchgeführt wurde, und zwar, daß die Schlafmittel A und B jedes für sich 
an zwei aus je 10 Personen bestehenden Gruppen ausprobiert werden. Wir hätten dann zwei 
voneinander unabhängige einfache Stichproben vor uns. Die eine besteht aus 10 Beobach- 
tungen der Zufallsvariablen X, die andere aus 10 Beobachtungen der Zufallsvariablen Y. Wir 
nehmen an, X und Y seien normal N (m,; 0) bzw. N(m,; co) verteilt, und stellen die Hypo- 
these H,(m, = m,) auf, d.h., wir behaupten, die Wirksamkeit beider Mittel sei gleich. 
Um diese Hypothese zu verifizieren, benutzen wir die durch Formel (9.6.8) bestimmte Ver- 
teilung der Stichprobenfunktion U... 

Ist die Hypothese H,(m, = m,) richtig, so haben wir es mit Stichproben aus derselben 
normalen Gesamtheit zu tun. Um aus dem Beobachtungsmaterial den Wert « zu berechnen, 
entnehmen wir zuerst der Tabelle 12.2.1 die Werte 


1 1 
Te — = 2, 3, y= — — 1,10, 
San De 3 IT Dy = 0,75 


103 = I (x — 2)? = 36,1, 1083 = 3 (y — W)? = 28,9 
und erhalten 
—yY 100 
yo®+S 20 


Wie man weiß (siehe 9.6), hat die Variable U eine Studentsche t-Verteilung mit 18 Freiheits- 

. graden. Den Tafeln der t-Verteilung entnehmen wir, daß die Währscheinlichkeit dafür, einen 

absoluten £-Wert nicht kleiner als 1,86 zu erhalten, gleich P = 0,08 ist. Das erhaltene Ergebnis 

widerspricht also nicht der Hypothese H,(m, = m,), sogar un einmal bei der Sicherheits- 
wahrscheinlichkeit & = 0,05. 


u= 


Beim Vergleich dieses Schlusses mit dem im Beispiel 12.2.1 formulierten 
Schluß mag es dem Leser unverständlich erscheinen, wieso beide Schlüsse ein- 
ander entgegengesetzt sind. Diese Tatsache kann man aber einfach und intuitiv 
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erklären. Im Beispiel 12.2.1 hat man die Wirksamkeit beider Mittel an den- 
selben Patienten untersucht. Ist also die durchschnittliche Wirksamkeit beider 
Mittel dieselbe, dann müßte man nur kleine Differenzen in den Auswirkungen 
beobachten. Die beobachteten Differenzen ? — % kann man also nicht durch 
zufällige Schwankungen (bei der angenommenen Sicherheitswahrscheinlichkeit) 
erklären. Im Beispiel 12.2.6 untersucht man dagegen den Unterschied in der Wirk- 
samkeit dieser beiden Mittel an zwei verschiedenen Patientengruppen. Hier kann 
man auch dann, wenn die Hypothese H,(m, = ms) richtig ist, größere Differen- 
zen erwarten. 

Im Beispiel 12.2.6 betrachteten wir zwei normale Grundgesamtheiten mit den 
unbekannten Mittelwerten m, und m, und den unbekannten Standardabweichun- 
“ gen o, und o,. Wir hatten als sicher, d. h. als keines Beweises bedürftig angenom- 
men, daß 0, = 0, = ist, wobei der Wert von o nicht näher spezifiziert wurde, 
und wir formulieren die Hypothese H,(m, = m,). Somit haben, wenn die Hypo- 
these H, richtig ist, die in diesem Beispiel betrachteten Zufallsvariablen X und Y 
die gleiche Normalverteilung. Die Hypothese H, wurde auf der Basis der Student- 
schen {-Verteilung überprüft. In der Praxis ist es jedoch häufig notwendig, ent- 
weder die Hypothese H,(m, = m,, 0, = o,) oder die Hypothese H,(m, = m,) 
ohne die Annahme o, = o, zu überprüfen. Betrachten wir somit die Hypothese 
H,, so muß die Annahme o, = o, überprüft werden, betrachten wir hingegen die 
Hypothese H,, so schließen wir die Möglichkeit o, + o, nicht aus, d.h., daß X 
und Y verschiedene Normalverteilungen haben. 

Das Problem der Überprüfung der Hypothesen H, und H, war Gegenstand 
vieler Diskussionen und Kontroversen. Wir erwähnen hier die Arbeiten von 
FısHer [7], [12], NeymAn und Prarsov [2], SurArme [2], Hsu [1]und Weron [1]. 


12.3 Parametertests für große Stichproben 


Wir wollen an Beispielen zeigen, wie man bei Signifikanztests die Grenzver- 
teilung von Stichprobenfunktionen benutzen kann. 


Beispiel 12.3.1. Die Verteilung des Merkmals X einer Gesamtheit sei unbekannt; es 
möge aber die Standardabweichung o = 5 dieser Verteilung gegeben sein. Dieser Gesamtheit 
entnehmen wir eine einfache Stichprobe vom Umfang 50. Der Mittelwert m des Merkmals X 
der Gesamtheit sei ebenfalls unbekannt. Wir stellen die Hypothese H,(m = 0) auf. Die Stich- 
probe ergab den Wert 7 = 2. Die Hypothese H, ist zu testen. 

Aus der Existenz einer endlichen Standardabweichung folgt (siehe 9.11): Bi die Hypothese 


El, richtig,'so ist die Stichprobenfunktion X asymptotisch normal N (0 a)rgent Aus 
den Tafeln der Normalverteilung finden wir y2 


p(IX]22) = P(IXV2 > 2y2) » P(|X|V2 = 2,82) < 0,01. 
Wir lehnen also die Hypothese H, ab. 


In Beispiel 12.3.1 setzen wir voraus, daß die Standardabweichung der Grund- 
gesamtheit bekannt ist. Gewöhnlich ist sie aber in praktischen Fällen nicht 
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bekannt. Ist die Stichprobe jedoch umfangreich genug, so-können wir die Stan- 
dardabweichung aus der Stichprobe bestimmen, also oa =s annehmen. Dies ist 
aber nur dann möglich, wenn die Stichprobe wenigstens 100 Elemente enthält. 


Beispiel 12.3.2. Wir haben eine einfache Stichprobe vom Umfang rn = 150 Elemente. 
Aus ihr bestimmen wir die Werte 7=0,4 und s=4. Wir kennen weder den Mittelwert 
noch die Standardabweichung der Gesamtheit. Ist die Hypothese H,(m — 0) abzulehnen? 

Wenn wir 0 =s nehmen und die Hypothese H, richtig ist, dann ist die Zufallsvariable X 


4 
asymptotisch normal N (0 =) verteilt. Wir erhalten 


Es besteht also kein Grund, die Hypothese HZ, abzulehnen. 


Wie wir sehen, benutzt man in umfangreichen Stichproben Grenzverteilungen 
und nimmt außerdem in einigen Fällen noch an, daß die Werte der anderen 
Parameter (außer dem Parameter, der nachgeprüft werden soll) den aus der 
Stichprobe errechneten Parameterwerten gleich sind. Dazu bemerken wir, daß die 
Aussage, ob eine Stichprobe als groß oder klein anzusehen ist, davon abhängt, 
welchen Parameter die Hypothese betrifft, und davon, ob die Stichprobenfunk- 
tion, die die Grundlage des Parametertestes bildet, schnell oder langsam stocha- 
stisch gegen uen gesuchten Gesamtheitsparameter konvergiert. Bestimmt man aus 
der Stichprobe auch noch andere Parameter (wie dies im Beispiel 12.3.2 der Fall 
ist), so ist für sie derselbe Umstand zu beachten. 


Beispiel 12.3.3. Ein Merkmal, das in der allgemeinen Landwirtschaftszählung untersucht 
wurde, ist der Besitz eines Arbeitspferdes. Wir wollen feststellen, wieviel landwirtschaftliche 
Betriebe in den Woiwodschaften A und B ohne Arbeitspferd sind. Dazu wählen wir nach dem 
Bernoullischen Schema r, = 1500 Zählformulare der Woiwodschaft A und n, = 1800 der 
Woiwodschaft B. Der Anteil der Landwirtschaften ohne Pferd beträgt in den Stichproben, 
die den Woiwodschaften A bzw. B entnommen sind, 


300 320 


= —— = 0,200 bzw. 92 = —— = 0,178. 
1500 1800 


Pı 
Wir stellen die Hypothese H, auf, daß in beiden Woiwodschaften der Anteil der Land- 
wirtschaften ohne Pferd der gleiche ist und p beträgt und daß nach dieser Hypothese die in 
diesen Stichproben beobachteten Unterschiede zwischen 9, und 9, zufällige Schwankungen 
sind. ; 

Diese Hypothese wollen wir mit der Sicherheitswahrscheinlichkeit & = 0,05 testen. 

Wir ordnen dem darin bestehenden Ereignis, daß wir ein Formular einer Landwirtschaft 
ohne Pferd auslosen, die Zahl 1 und dem entgegengesetzten Ereignis die Zahl 0 zu. Also 
haben wir es hier mit Zufallsvariablen X,, die eine Null-Eins-Verteilung haben, zu tun. 
Der Wert p, = 0,200 stellt den beobachteten Wert der Zufallsvariablen Y in einem Bernoulli- 


1 
schen Schema dar; dabeiist Y= — 3’X,, rn, = 1500, während p, = 0,178 der beobach- 
N 
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tete Wert der Zufallsvariablen Z in einem Bernoullischen Schema ist: Z= & Xu 
N, = 1800. "2 

Ist die Hypothese H, richtig, so ist E(Z)=E(Y)=». Die Standardabweichungen der 
Zufallsvariablen Y bzw. Z sind auf Grund der Formeln (5.2.8) gleich 


»i1-p) pi —») 
o,= || — —— bzw. o,= || ——. 
1500 1800 


Die Zufallsvariablen Y und Z sind voneinander unabhängig, also hat die Zufallsvariable 
Y — Z auf Grund der Formeln (3.2.14) und (3.6.17) die Standardabweichung 


i1p(l —-») 
o= are 


Die Zufallsvariable 7 — Z hat eine asymptotische Normalverteilung 


n (0 y =>). 
9000 


Würden wir den Wert von p kennen, so könnten wir den genauen Wert von o berechnen. 
Da die Stichprobenumfänge aber groß sind, können wir für den Wert p» das folgende Mittel 
von p, und 9, nehmen, nämlich i 


1.500 1800 { 
m TEN DR 1x 0,188. 
3300 
Wir erhalten o = 0,0137. Der von uns beobachtete Wert der Zufallsvariablen 7’ — Z ist 
2ı — Pa = 0,022. Aus den Tafeln der Normalverteilung lesen wir ab: 


IY-Z|__ 0,022 RZ) 
P(Y — Z| 2 0,022) = P > =p > 1,61) = 0,107. 
0,0137 0,0137 0,0137 


Wie wir sehen, führt hier der Signifikanztest mit der Sicherheitswahrscheinlichkeit « = 0,05 
nicht zur Ablehnung der Hypothese H,. Die Ergebnisse der ausgeführten Stichproben schließen 
nieht die Möglichkeit aus, daß der Prozentsatz der Landwirtschaften ohne Pferd für beide 
Woiwodschaften der gleiche ist. 


Beispiel 12.3.4. Man untersuchte den Roggenbrotverbrauch eines Normalverbrauchers!) 
für Arbeiterfamilien in Warschau und L6dz und in Görny Siask (Oberschlesien). So hat 
man in Warschau und ZLöd2 n, —= 65 Familien und im oberschlesischen Industriegebiet 
%, = 57 Familien untersucht. Wir bezeichnen den Brotverbrauch in Kilogramm pro Normal- 
verbraucher mit X. Die untersuchten Familiengruppen kann man als einfache Stichprobe 
aus den Gesamtheiten der Arbeiterfamilien in Warschau und Lödz bzw. der oberschlesischen 
Familien betrachten. Unter m, bzw. m, verstehen wir den mittleren Roggenbrotverbrauch 
in Warschau und Lödz bzw. in Oberschlesien. 


1) Unter einem N ormalierbraucher versteht man einen Mann, der 18 Jahre oder älter ist; 
der Nahrungsmittelverbrauch von Personen, die einer anderen Alters- oder Geschlechtsgruppe 
angehören, wird nach speziellen Skalen umgerechnet. 
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Die beobachteten Stichprobenmittelwerte betragen 7, = 9,95, 7, = 10,28. Wir stellen 
die Hypothese auf, daß die durchschnittlichen Verbrauchswerte m, und m, einander gleich 
sind. - : 

_ Den Wert Z, — %, können wir als beobachteten Wert der Zufallsvariable X, — X, an- 
sehen, deren Verteilung wegen der Größe des Stichprobenumfanges als normal angenommen 
werden kann. Ist die Hypothese Z, richtig, so haben wir es hier mit der Normalverteilung 


a © i ; 
N (o BESER a) zu tun, wobeio, bzw. o, die Standardabweichungen der Zufallsvariablen X 
‚7 Na 


in Warschau und Lödz bzw. in Oberschlesien sind. Wir kennen diese Werte nicht. Da aber die 
Stichprobenumfänge nicht klein sind, nehmen wir für sie die aus den Stichproben erhaltenen 
Abweichungen. Diese betragen s, —4,22 und s, = 6,01, die Standardabweichung der Variablen 
X, — X, beträgt also 0,95. Da in unserem Beispiel #, — &, = —0,33 ist, finden wir aus den 
Tafeln der Normalverteilung die Wahrscheinlichkeit dafür, daß eine normale Variable mit 
der Verteilung N (0; 0,95) absolut genommen nicht kleiner als 0,33 ist, den Wert 0,7264. 
Testen wir die Hypothese #, mit der Sicherheitswahrscheinlichkeit & = 0,05, so besteht kein 
Grund zu ihrer Ablehnung. 


Beispiel 12.3.5. Strrie und FREUDENTEAL [1] beschreiben die Ergebnisse einer in Holland 
an 5001 Frauen durchgeführten anthropometrischen Untersuchung. Diese Untersuchungen 
dienten den Bedürfnissen der Konfektionsindustrie, sie bezweckten die Auswahl einer Reihe 
von Mannequins, so daß die nach diesen Modellen hergestellten Bekleidungsstücke und 
Schuhe den holländischen Frauen möglichst gut paßten. Unter den untersuchten Merkmalen 
befanden sich unter anderen die Körpergröße Y und die Länge des Mittelfingers X. Aus den 
Messungen fand man für den Korrelationskoeffizienten zwischen diesen Merkmalen den Wert 
r = 0,5062. 

Wir stellen die Hypothese A,(e = 0) auf, d.h., wir nehmen an, daß der Korrelations- 
koeffizient zwischen den betrachteten Merkmalen der Gesamtheit gleich 0 ist. Da die Stich- 
probe sehr groß ist, können wir annehmen, daß R normal verteilt ist, und die Formeln (9.9.9) 
für E(R) und D?(R) benutzen; dabei ersetzen wir in ihnen den unbekannten Wert g durch 0. 
ist die Hypothese F, richtig, so hat R eine in Annäherung normale N (0; 0,0141) Verteilung. 
Wir können leicht feststellen, daß die Verifizierung der Hypothese H,(e = 0) sogar mit der 
Sicherheitswahrscheinlichkeit & = 0,01 zur Ablehnung dieser Hypothese führt; der Korre- 
lationskoeffizient o ist also wesentlich von Null verschieden. 


12.4. Anpassungstests. Der y?-Test 


A. Es sei f(x) die unbekannte Verteilungsfunktion der Zufallsvariablen X. 

Eine statistische Hypothese, die die unbekannte Gestalt der Verteilungsfunk- 
tion F (x) festlegt, nennt man nichtparametrisch. 

Ein Verfahren, das zur Verifizierung einer nichtparametrischen Hypothese 
dient, nennt man einen Anpassungstest oder-nichtparametrischen Test. 

Um eine nichtparametrische Hypothese nachzuprüfen, gehen wir folgender- 
mäßen vor. Wir stellen die Hypothese 7, über die Verteilungsfunktion F (x) 
auf. Der Grundgesamtheit entnehmen wir eine Stichprobe vom Umfang n und 
untersuchen in ihr die Verteilung des Merkmals X. Diese empirische Verteilung 


12.4. Anpassungstests. Der x?-Test 507 


wird im allgemeinen von der durch die Hypothese H, festgelegten Gesamtvertei- 
lung verschieden sein, und auch dann, wenn die Hypothese richtig ist, ist im all- 
gemeinen in verschiedenen Stichproben aus derselben Gesamtheit die empirische 
“ Verteilung verschiedenartig. Ist nun die Hypothese richtig, so können sich diese 
empirischen Verteilungen nicht wesentlich von der hypothetischen Verteilung 
unterscheiden. Um diese Erscheinung quantitativ zu erfassen, müssen wir eine 
Stichprobenfunktion U konstruieren, die ein Maß für die Abweichung (oder 
Divergenz) der empirischen Verteilung von der hypothetischen darstellt. Die 
weitere Verfahrensweise ist dann analog zu derjenigen, die bei Parametertests 
angewandt wurde: Wir bestimmen einen Wert u, derart, daß dann, wenn die 
Hypothese H, richtig ist, PÜZw)<« gilt, wobei « die Sicherheitswahr- 
scheinlichkeit ist. Ist der aus der untersuchten Stichprobe berechnete Wert u 
größer oder gleich u,, so lehnen wir die Hypothese Z, ab. Wenn dagegen u < %, 
ist, so besteht kein Grund zur Ablehnung von Ä,, und wir müssen über die An- 
nahme dieser Hypothese durch weitere Untersuchungen entscheiden. 


B. Oft wird die von K. Pearson [5] stammende Stichprobenfunktion x? als Maß 
für die Abweichung benutzt. Wir erinnern daran, daß eine Stichprobenfunktion 
desselben Namens schon in Kapitel 9 besprochen wurde. Wie wir sehen werden, 
sind die Verteilungen der gleichbenannten Stichprobenfunktion eng miteinander 
verknüpft. Man darf aber nicht vergessen, daß ihre Definitionen völlig ver- 
schieden sind. 

Wir wollen jetzt die Pearsonsche Stichprobenfunktion y° definieren. Es sei 
F (x) die gegebene Verteilungsfunktion der Grundgesamtheit. Wir zerlegen die 
x-Achse in r paarweise punktfremde Mengen 8;. Es sei 


TC (k = 1, 2,2..,r) 


die Wahrscheinlichkeit dafür, daß die Zufallsvariable X einen Wert aus S,; an- 
nimmt. Wenn wir für 8, die Intervalle [a;, @.,1) nehmen, erhalten wir 


I — F (a1) = F (a,). (12.4.1) 


Die Zahlen x, wollen wir theoretische Häufigkeiten nennen. 

Es mögen nun n voneinander unabhängige Beobachtungen x, x, ..., 2%, der 
Zufallsvariablen X vorliegen. Diese Beobachtungen teilen wir in r Gruppen ein. 
Zur k-ten Gruppe zählen wir diejenigen Werte, die der Menge 8, angehören. 
‚In der k-ten Gruppe seien n, (k=1,2,...,r) Elemente vorhanden. In ver- 
schiedenen Stichproben vom Umfang n können für ein festes k die Werte n; 
verschieden ausfallen; n, ist für feste k eine binomial verteilte Zufallsvariable. 
Die Stichprobenfunktion 


(12.4.2) 
k=1 NICK 


nennen wir die Pearsonsche Stichprobenfunktion z2. 
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Satz 12.4.1. Die theoretischen Häufigkeiten m, seien bestimmt. Die Folge {F',(z)} 
der Verteilungsfunktionen der durch die Formel (12.4.2) bestimmien Stichproben- 
funktion x? genügt dann den Beziehungen 


r-1i R 
im P,@)=!g® r ( 1 ) ö (12.4.3) 
2 
| 0 i fürz<0. 


Der Ausdruck (12.4.3) stellt eine x2-Verteilung (siehe 94) mit r — 1 Frei- 
heitsgraden dar. 


Beweis. Die Wahrscheinlichkeit dafür, daß unter den Bedingungen dieses 
Satzes n, Beobachtungen zur Menge S,,n, zur Menge $,,...,n, zur Menge $, 
gehören, wobei nn +" +m, =n gilt, ist gleich ' 


n! 
m —— ee T. (12.4.4) 
n,!ng!--.n,! 


Dieser Ausdruck stellt die Wahrscheinlichkeit in einer Polynomialverteilung 
(siehe 5.12) dar. Die charakteristische Funktion p(t,, ..., i,) dieser durch (12.4.4) 
gegebenen Wahrscheinlichkeitsfunktion hat die Form 


I (Zme“) 
k=1 
Wir betrachten die Zufallsvariable 


N: — NIT 


Y,.= os 
? Ynz; 


Es ist 
5 Tr EN 
=}, 7, IY.Yr =0. 
k=1 


Aus der letzten Gleichung ersehen wir, daß die Variablen Y,, linear abhängig sind. 
Die charakteristische Funktion der gemeinsamen Verteilung von (Y,, Y;,..-, Y,) 
hat die Form 


lt ...,&) = exp (- Lit Ya) (Eros — ) . (12.4.5) 
= 7%% 
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Daraus erhalten wir 


log oft, ta,...,&) = im $ 6 Yu + n log (Eon v= )) 
NIC 


. _ r BIER Tg 1 r j 1 
= m Zum aeli+ Zuln-2,258+0(,)) 
k=1 Yn #=1 2n v1 n 


— —i Yn Zt Ye + nlog(1 +2) 
k=1 


mit 


Wenn wir beachten, daßz für n — 00 gegen Null strebt, so können wir log (1 + 2) 
.. in eine Reihe entwickeln. Wir erhalten. so 


ae r Dr 1 r r —\2 
nlog (1 +2) — in Zum -,|&4 - (Em) 
k-1 2 |x=ı k=1 
Schließlich ergibt sich 


r r _—\2 
lim p(ty ta ..., 6) = exp ı- F > I (& by Im) | (12.4.6) 


NO 


Wir zeigen nun, daß man eine orthogonale Transformation 
r 
= N Al; (k=1,2,..,r) 
il 
finden kann, deren Koeffizienten 4,; durch 


— Yr, (=12,...,r) 


gegeben sind. 
Hier sind r? Koeffizienten unbekannt. Aus der Orthogonalitätsbedingung folgt, 


daß diese die r + ae) Gleichungen 
% 1 fü k=;, 
2 9; = be i 
je 0 für k#i 


erfüllen müssen. Überdies legten wir r — 1 Koeffizienten fest (in Wirklichkeit 


1 
bestimmten wir r Koeffizienten, die aber durch die Beziehung Sa); =1 mit- 
je 
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einander. verknüpft sind). Es bleiben also noch r? — (r — 1) Koeffizienten un- 
bestimmt; diese können wir aber bestimmen, denn es ist 


r(r—]) r —3r +2 


r?—- (r— 1) —- r - — —>{I fü r22. 
2 2 
Die quadratische Form, die auf der rechten Seite der Formel (12.4.6) vorkommt, 
nimmt nach Einsetzen der Werte u,, %,, ..., u, die folgende Gestalt an: 
r—1 & 
Zw- 
k=1 


Der Formel (12.4.6) wegen erhalten wir, daß die charakteristische Funktion 
der gemeinsamen Zufallsvariablen (Y,, Ya» ..., Y,) für n— 00 gegen die 
charakteristische Funktion der gemeinsamen Verteilung von r — 1 unabhängigen 
Zufallsvariablen strebt, deren jede nach N (0;1) verteilt ist. Aus einem in diesem 
Buch nicht bewiesenen Satz, der eine Verallgemeinerung von Satz 6.6.1b auf 
mehrdimensionale Verteilungen darstellt, folgt, daß (Y,,Y., ..., Y,) eine asym- 
ptotische Normalverteilung hat, die durch den Limes der charakteristischen 
Funktionen bestimmt ist. Schließlich erhalten wir also, daß die durch Formel 
(12.4.2) bestimmte Stichprobenfunktion x? asymptotisch eine Quadratsumme von 
r — 1 unabhängigen Zufallsvariablen ist, die nach N (0;1) verteilt sind, und folg- 
lich als Grenzverteilung eine y?-Verteilung mit r — 1 Freiheitsgraden hat. Damit 
ist der Satz bewiesen. 


©. Satz 12.4.1 bildet die Grundlage eines weitverbreiteten Anpassungstests, 
der z?-Test genannt wird. Wir erläutern seine Bedeutung durch ein Beispiel. 


Beispiel 12.4.1. Einer Warenladung entnehmen wir eine n —= 100 Elemente zählende 
einfache Stichprobe und finden in ihr rn, = 22 fehlerhafte Stücke. Auf Grund dieser Stichprobe 
wollen wir mit der Sicherheitswahrscheinlichkeit & = 0,01 die Hypothese Z, testen, die aus- 
sagt, daß sich während der Stichprobenerhebung die Wahrscheinlichkeit dafür, ein fehler- 
haftes Exemplar auszulosen, nicht änderte und stets p = 0,20 betrug. Mit anderen Worten, 
nach dieser Hypothese ist n, = 22 der beobachtete Wert einer binomial verteilten Zufalls- 
variablen mit ? = 0,20 und r = 100. 

Wir benutzen den y?-Test. Durch die Hypothese F, ist die Merle vollständig be- 
stimmt, und wir können den Satz 12.4.1 anwenden. 

Die Stichprobe teilen wir in nr, fehlerhafte und 2,=n —n, fehlerlose Stücke auf. Die 
theoretischen Häufigkeiten dieser Gruppen betragen p = 0,2 bzw. g=1—-9=0,8. Aus 
Formel (12.4.2) erhalten wir 

„_ Mm np? a. rt a 


Rn an ao or 


Hier haben wir zwei Gruppen, also r = 2, und wir betrachten daher die x?-Verteilung mit 
einem Freiheitsgrad. Aus den y2-Tafeln lesen wir P(y? > 6,6) = 0,01 ab; also ist die Wahr- 


1 
scheinlichkeit, daß der Wert x? nicht kleiner als Er ist, bedeutend größer als 0,01. Es besteht 


also kein Grund, die Hypothese Z, abzulehnen. 
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Bei Anwendung des y?-Tests ist zu bedenken, daß dieser auf dem Satz über die 
Grenzverteilung beruht. Die in diesem Test auftretenden Zahlen rn; können daher 
nicht klein sein. Man kann hier zur Orientierung die Regel angeben, derzufolge 
die Anzahl der Beobachtungen so in Gruppen zu zerlegen ist, daß. nr, > 10 ist, 
d.h., daß die mittlere Anzahl der Beobachtungen in jeder Gruppe nicht kleiner 
ist als 10. Manche Autoren nehmen als Regel an, daß in jeder Gruppe nicht 
weniger als fünf Elemente auftreten; dies bezieht sich speziell auf Randgruppen. 
Einer tieferen Untersuchung des Problems der Anzahl der Gruppen, in die sämt- 
liche Beobachtungen zu unterteilen sind, ist die Arbeit von Mann und Wauo [1] 
gewidmet. In dieser Arbeit empfehlen Mann und Warn die Zerlegung der z- 
Achse in Intervalle mit gleichen theoretischen Häufigkeiten. Ist dann die Anzahl 


1 
der Intervalle gleich r, so ist demzufolge u =— (k=1,2,...,r) zu setzen. 
r 


Im Zusammenhang mit der Arbeit von Mann und WAL gibt WILLIAMS [1] numeri- 
sche Daten zur Anzahl und zur Länge dieser Intervalle an. Eine ausführliche Be- 
schreibung der Anwendbarkeit des y?-Tests findet man in der Arbeit von CocHRAN 
[2]. Es ist erwähnenswert, daß VESSEREAU [1] durch Vergleich der exakten, durch 
(12.4.2) definierten 7?-Verteilung mit der y?-Grenzverteilung mit r — 1. Freiheits- 


graden für z; = a und kleine » (etwa 15 bis 20) festgestellt hat, daß man, 
r 


ohne einen größeren Fehler zu befürchten, die y2-Grenzverteilung für den y?-Test 
mit der Sicherheitswahrscheinlichkeit & = 0,05 oder & = 0,01 anwenden kann, 
sogar dann, wenn . =1(k =1,2,..., r) ist. 

TUMANJAN [1] und GicaMmaAn [4] untersuchten die y2-Grenzverteilung für den 
Fall, daß die Anzahl der Intervalle, in die die (— oo, oo)-Achse zerlegt wird, für 
n > 00 gegen oo geht (siehe Aufgabe 12.8.7). 


D. Bis jetzt betrachten wir nur den Fall, daß die Hypothese H, die Verteilung 
vollständig bestimmt. Wenn dagegen die Hypothese 7, nur die Gestalt der Ver- 
teilung, nicht aber die Parameter A, Ag -..,/m bestimmt, so kann man auch 
nicht die Werte von r; [nach der Formel (12.4.1)] ermitteln. In diesem Fall kann 
der Satz 12.4.1 nicht mehr als Grundlage für einen Test dienen. 

FısHER [4] zeigte jedoch, daß man in diesem Fall den Satz 12.4.1 nur etwas 
zu ändern braucht, um ihn wieder anwenden zu können. Die Darlegung des 
Fisherschen Ergebnisses erfordert die Einführung des Begriffs der Likelihood- 
Funktion. Die Bedeutung dieser Funktion werden wir im nächsten Kapitel 
genauer kennenlernen. 

Wir nehmen an, die Gestalt der Verteilungsfunktion F (x), nach der ein Merk- 
mal X in einer gewissen Gesamtheit verteilt ist, sei bekannt, während die Para- 
meter A,, Ag, ..., Am unbekannt sind. Der Gesamtheit entnenmen wir eine einfache 
Stichprobe vom Umfang n, wobei die Werte x,, &,, ..., %„ beobachtet werden. 

Wir unterscheiden zwei Fälle, je nachdem, ob die Zufallsvariable X diskret 
oder stetig ist. 


leitungen —- 
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Nehmen wir an, die Zufallsvariable X sei diskret. Es bezeichne 9, die Wahr- 
scheinlichkeit für das Eintreffen von X =2, (k=1,2,...,n). Die Wahrschein- 
lichkeiten 9, sind Funktionen der unbekannten Parameter A,, Ay .- -, Am- 


Definition 12.4.1. Für eine diskrete Zufallsvariable bezeichnen wir das Pro- 
dukt 


L = Prldys Ay ons Am) PalAy Ad eu Am)" Pr (Ay Ads ee, Am) (12.4.7) 


als Zökelihood- Funktion. 
Nun sei die Zufallsvariable X stetig verteilt mit der Dichte f(x, A,, A ..., Am). 


Definition 12.4.2. Für stetige Zufallsvariable bezeichnen wir das Produkt 
L = a1, Ay Ay e.r5 Am) (Co Ars Ad ee Am) ln Ans Ads er, Am) (12.4.7) 


als Likelihood-Funktion. 
Natürlich hängt die Likelihood-Funktion L von den Parametern 


IE ee 22 


ab. Wenn wir die Werte dieser m unbekannten Parameter aus dem System der m 
Gleichungen 


L 
op. Se (12.4.8) 
04; 
bestimmen, so sagen wir, daß wir das Lösungssystem Af, 45, ..., A5 dieser Gleichun- 


gen nach dem Maximum-Likelihood-Prinzip gewonnen haben. 

Wir wollen nun annehmen, wir hätten die x-Achse in r Intervalle zerlegt und 
entsprechend die 2 Beobachtungen in r Gruppen zusammengefaßt. Es mögen 
und n; die gleiche Bedeutung haben wie in (12.4.2). Offenbar sind die r, Funk- 
tionen der unbekannten Parameter A,, Ay, ...,Am. Wir nehmen m<r an und 
betrachten den Ausdruck 


DL — au (Ay Ay een Am) 9 700" (Ay Ayp een, Am) (12.4.9) 


Dieser Ausdruck ist die Likelihood-Funktion nach der Gruppierung der Beobach- 


tungen. Der früher erwähnte Fishersche Satz, der von CRAm&r ([2], $ 30,3) präzi- 
siert wurde, lautet: 


Satz 12.4.2. Es seien alle rı.(A,, Ag -.., Am) > 0, und es mögen die stetigen Ab- 
On den. 


A k=1,2,..,r;%, 5j=1,2...,m) existieren. Ferner 
a 000, \ I m) 


ö 
habe die Matrix der ER (k=1,2,..,r;i=1,2,...,m) den Rang m. Sind 


T 
dann die unbekannten Parameter }y, 9 ..-, Am nach dem Maximum-Likelihood- 
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Prinzip nach Gruppierung der Beobachtungen, d.h. aus dem Gleichungssystem 

(12.4.8) ermittelt worden, wobei L durch (12.4.9) gegeben ist, so strebt die Verteilung 

der durch (12.4.2) definierten Stichprobenfunktion x? gegen die y2-Verteilung mit 
r—m-—1 Freiheitsgraden. 

Den Beweis dieses Satzes findet der Leser bei CRAMER 2]. 

Die Auflösung des Gleichungssystems (12.4.8) stößt, wenn L durch (12.4. 9) 
gegeben ist, in der Praxis auf große Schwierigkeiten. Gewöhnlich ist es weitaus 
günstiger, das Gleichungssystem (12.4.8) aufzulösen, wenn die Likelihood-Funk- 
tion L durch (12.4.7) oder durch (12.4.7’) gegeben ist, d. h., wenn sich die Likeli- 
hood-Funktion aus den Beobachtungen vor ihrer Gruppierung errechnet. Jedoch 
ist dann der Satz 12.4.2 nicht mehr erfüllt. Darauf hat Fısmer [9] hingewiesen. 
CHERNOFF und LEHMANN [1] haben folgenden Sachverhalt nachgewiesen: Genügen 
die Funktionen 77; (A,, Ag, ..., A”) den Voraussetzungen des Satzes 12.4.2 und ge- 

 nügt die Dichtefunktion: f(x, Ay, ...,Am) oder evtl. die Wahrscheinlichkeitsfunk- 
tion P(A1, Ay, -.., Am) den Voraussetzungen des Satzes 13.7.3 oder besser noch den 
Voraussetzungen der Verallgemeinerung dieses Satzes auf den Fall mehrerer un- 
‘ bekannter Parameter (siehe 13.7), so hat die durch (12.4.2) definierte Stichproben- 
funktion 4? für n— oo die gleiche Verteilung we U+a,Y?-+-.-.+0,72, 
wobei U die x?-Verteilung mit r— m — 1 Freiheitsgraden hat, während die Y,, 
Y3..., Y„m die Normalverteilung N (0;1) haben. Dabei sind dieU, Y,, Y» ..., Ym 
unabhängig, während die a,, @,, ..., @„ gewisse Zahlen zwischen 0 und 1 sind (das 
Verfahren zur Berechnung der q,, @,, ..., @, ist bei CHERNOFF und LEHMANN [1] 
angegeben). Ist die Anzahl r der Gruppen groß, so kann man ohne Bedenken die 
Behauptung des Satzes 12.4.2 anwenden, wobei Z nach (12.4.7) oder nach (12.4.7’) 
zu berechnen ist. Ist hingegen r klein, so sind die Ergebnisse, die man aus einer 
derartigen Anwendung des Satzes 12.4.2 gewinnt, mit äußerster Vorsicht in An- 
wehdung zu bringen. 
Warsor [1], [2] kommt bei der Betrachtung des Falles, daß die x- Achse in Inter- 


; 1 ” 
valle mit konstanten theoretischen Häufigkeiten ,; = — zerlegt wird, zu Folge- 
r 


rungen, die denen von CHERNOFF und LEHMANN [1] analog sind. Wir empfehlen 
dem Leser die Arbeiten von Neyman und PEARSoN [1] sowie von NEyMan [8]. 
In der zuletzt genannten Arbeit werden gewisse Modifikationen und Verallgemei- 
nerungen des y2-Tests betrachtet. Darüber hinaus wird dort eine Methode zur 
Bestimmung der unbekannten Parameter aus der Stichprobe angegeben, dessen 
Spezialfall das Maximum-Likelihood-Prinzip ist. 


Beispiel 12.4.2. Dieses Beispiel wurde dem Buch von Boszw [1] entnommen. Man hat 
300 Baumwollgarnrollen, die einer Baumwollpartie entnommen wurden, auf ihre Festigkeit 
untersucht. Mit X wurde die Festigkeit in Kilogramm bezeichnet. Die beobachteten Werte 
x, wurden in 13 Gruppen aufgeteilt, wobei »; die Anzahl der Beobachtungen, die zur i-ten 
Gruppe gerechnet wurden, bezeichnet. Die Angaben wurden in Tabelle 12.4.1 zusammen- 
gestellt. 


33 Fisz, 
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Tabelle 12.4.1. 


C & | n; | i | x n; 
1 0,5—0,64 1 8 1,48— 1,62 53 
2 0,64—0,78 2 i 9 1,62—1,76 25 
3 0,78—0,92 9 10 1,76—1,90 19 
4 0,92—1,06 25 11 1,90-— 2,04 16 
5 1,06— 1,20 37 12° 2,04—2,18 3 
6 1,20—1,34 53 13 2,18—2,38 1 
7 1,34—1,48 56 


Wir wollen hier die Hypothese HZ, testen, daß das Merkmal X normal verteilt ist. Durch 
diese Hypothese ist weder der Mittelwert noch die Standardabweichung bestimmt; denn 
H, besagt nur, daß X irgendeine Normalverteilung besitzt. Wir müssen also den Wert dieser 
Parameter aus der Stichprobe berechnen, und zwar mit Hilfe des Maximum-Likelihood- 
Prinzips. 

Die Dichte der Zufallsvariablen X hat die Form 

_la-m)? 


1 : 
2 e 
Bd 


I(&, Mm, c) = 
0 V2r 


wobei die Parameter m und o unbekannt sind. Die Likelihood-Funktion ist auf Grund von 
(12.4.7) gleich 


1» n 
L= F | exp E 2 P2 (& — ar (r = 300). 


Daraus ergibt sich 


log L LS RL AN RL EL EN 
oO es % m)” — —— NR 10907 — — RIO . 
s Er Fa 


Wenden wir die Formel (12.4.8) an, so erhalten wir 


dlogL i 
am ze, 
ölgL 1. an j 
Far I (a — m)? — a 0. (12.4.10) 
i=1 


3 
mF— — ay=T, 
3 R ie1 
1 Br} R 
= — Ye. (12.4.11) 
R%ı=1 £ 


Also sind der Stichprobenmittelwert und die Stichprobendispersion gleichzeitig die Werte 
m* und o*, die man nach dem Maximum-Likelihood-Prinzip erhält. 
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Da die Intervalle in Tabelle 12.4.1 ziemlich schmal sind, können wir annehmen, daß die 
Beobachtungen in dem Mittelpunkt x; eines jeden Intervalls liegen. Aus Tabelle 12.4.1 er- 
halten wir auf diese Weise Tabelle 12.4.2. 


Tabelle 12.4.2. 


i %, N i % N; 
1 0,57 1 8 1,55 53 
2 0,71 2 9 1,69 25 
3 0,85 9 10 1,83 19 
4 0,99 ; 25 11 1,97 16 
5 1,13 37 12 2,11 3 
6 1,27 53 13 2,28 1 
7 1,41 56 


Die Berechnung ergibt 
m* = 1,41, o* = 0,26. 


Da die Randgruppen in Tabelle 12.4.1 sehr klein sind, vereinigen wir die zwei tiefsten und 
die zwei höchsten Gruppen in je eine. Um die theoretischen Häufigkeiten z, zu berechnen, 
benutzen wir die Tafeln der Normalverteilung. Die Intervallenden legen wir in die Mitte des 
Abstandes zwischen den benachbarten Punkten x; und x;,.. Für eine Veränderliche X mit 
der Verteilung N (1,41; 0,26) ergibt sich 


xX-14 
m = P(X < 0,18) + P(X 22,04) = P |. < 242 


X — 1,41 . 
+P Fe > 2,42) = 0,0156. 


26 

X—1,41 

7, = P078<X < 0,92)= P|—242 < ae > < —1,88) = 0,0223, 
X— 1,4 

rn, =P(0,92< X < 1,06) = P (15 s 0.36 130) 0,0584 
X — 1,41 

74,=P(106<X<120)=P (-15 s 026 01) = 0,1205, 

- X—1,41 

7 = P(120< X < 1,34) = P (-0s1 s 0.28 0.7) = 0,1846, 
X— 1,4 

n= P(1,34<X<1,48)= P (-027 Ss ae <O =) = 0,2128, 

X— 1,4 
= P(148 <SsX<16)=P (vor = oa > <o0O ) = 0,1846, 


33* 
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xX— 1,4 
= P(2<X<176)=P (081 ——,,— < 1,35) = 0,1205, 


ZN X—1,4 
7, = P(1,716<X< 1,90) = P (135 Ss a < 16) = 0,0584, 
X— 14 
FLAT P(1,90 s X < 2,04) = 1,88 Ss To < 2,42 = 0,0223. 
Wir berechnen 
10 Be 
a are a nu? _ 22,07. 
k=1 NT 


Da wir zwei Parameter aus der Stichprobe bestimmt haben, beträgt hier die Anzahl der 
Freiheitsgrade 7. Aus den Tafeln der x?-Verteilung finden wir, daß P(y? => 22,07) < 0,01 ist. 
Wir lehnen also die Hypothese H, ab. 


Beispiel 12.4.3. Im Beispiel 5.5.1 stellten wir eine gute Übereinstimmung zwischen der 
empirischen Verteilung der Todesfälle, die durch Huftritte verursacht wurden, und der 
Poissonschen Verteilung fest. Dabei wählten wir als Parameterwert A den Mittelwert der 
empirischen Verteilung.. 

Im Grunde genommen wurde hier die Hypothese aufgestellt, daB die betrachtete Zufalls- 
variable eine Poissonsche Verteilung hat, wobei, ohne eine Sicherheitswahrscheinlichkeit 
festzulegen, angenommen wurde, daß die Beobachtungsergebnisse mit der Hypothese über- 
einstimmen. i 

Jetzt wollen wir einen x?-Test mit der Sicherheitswahrscheinlichkeit & = 0,05 anwenden, 
um festzustellen, ob die beobachtete Divergenz zwischen der empirischen und der hypotheti- 
schen Verteilung nicht gegen die angenommene Hypothese spricht: 

Wir ändern die Tabelle 5.5.1, indem wir statt der Häufigkeit und Wahrscheinlichkeiten 
die beobachteten und die erwarteten Besetzungszahlen angeben, und erhalten so die Tabelle 
12.4.3, 


Tabelle 12.4.3. 


% 0 1 2 3 4 
beobachtete 
Anzahl n; 109 65 22 3 1 
erwartete 
Anzahl np; 108,8 66,2 20,2 4,2 0,6 


Die beiden letzten Gruppen hat man in eine vereint, da ihre Besetzungszahlen sehr klein 
sind. Es gilt 
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Da aus den Beobachtungen ein Parameter!) errechnet wurde, hat die Stichprobenfunktion 
4: zwei Freiheitsgrade. Den Tafeln für die 72-Verteilung entnehmen wir, daß der Wert 
P (x: = 0,3160) viel größer als & = 0,05 ist. Es besteht also kein Grund, die zu untersuchende 
Hypothese abzulehnen. . 


12.5.  Anpassungstests, die sich auf die Sätze von Kolmogoroff 
und Smirnow stützen 


A. Der Satz 10.11.1 von Kotmocororr kann ebenfalls als Grundlage für einen 
Anpassungstest dienen, der die Hypothese H,, durch welche eine stetige Ver- 
teilungsfunktion F(x) festgelegt wird, verifizieren soll. Wir wollen hier diesen 
Satz noch einmal formulieren. 

Es sei $,(x) die empirische Verteilungsfunktion (d.h. die Häufigkeit des Er- 
eignisses X < x) in einer einfachen Stichprobe vom Umfang n. Weiter setzen wir 


D,= sup |F(a)— 8,(«)]. | (12.5.1) 


=-O<L<o 


Nach dem Kolmogoroffschen Satz besteht für 1 > 0 die Gleichung 


lim Q,(4) = lim P (> < =) =Q() (12.5.2) 
Nn>00 NO 17 

mit 
Qu = F (tet, (12.5.3) 


Wir nehmen als Hypothese H, an, daß das Merkmal X in der Gesamtheit nach 
der stetigen Verteilungsfunktion F (x) verteilt sei. Dieser Gesamtheit entnehmen wir 
eine genügend umfangreiche einfache Stichprobe und berechnen die empirische 
Verteilungsfunktion 8, (2) und die Stichprobenfunktion D,. 

Um die Hypothese mit. der Sicherheitswahrscheimlichkeit & nachzuprüfen, 
suchen wir in Tafel VIII einen solchen Wert A,, daß Q(4,) =1.-— x ist. Ist der 


beobachtete Wert von D, größer oder gleich A, so lehnen wir die Hypothese Z, 
n 


ab. Im entgegengesetzten Fall besteht kein Grund zu ihrer Ablehnung. 


Beispiel 12.5.1. In Tabelle 12.5.1 ist auf Grund einer Arbeit von WISZNIEWSKL [1] die 
Verteilung der Monatsdurchschnittstemperaturen in Warschau für die Jahre von 1779 bis 
1947 (ohne das Jahr 1945) angegeben. Die Gesamtanzahl der Beobachtungen beträgt also 
n = 168. 


1) Im Beispiel 13.7.1 werden wir beweisen, daß & die Abschätzung des unbekannten Para- 
‚ meters A nach dem Maximum-Likelihood-Prinzip darstellt. 
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Es sei X die Durchschnittstemperatur für. Januar in Warschau; mit x, bzw. n, ist in 
Tabelle 12.5.1 der beobachtete Wert der Zufallsvariablen X bzw. die Anzahl der Beobachtun- 
gen x, bezeichnet. Aus dieser Tabelle hat man 


== —4,22, s = 3,57 


berechnet, wobei & bzw. s der Stichprobenmittelwert bzw. die Stichprobenstandardabweichung 
sind. Wir stellen die Hypothese H, auf, wonach die Zufallsvariable X die Normalverteilung 
N (--4,22; 3,57) hat, und verifizieren diese Hypothese mit der Sicherheitswahrscheinlichkeit 
& == 0,05. Dazu benutzen wir den Satz von KoLMOGorRorFF. Wir bestimmen die Werte der 
Verteilungsfunktion einer Zufallsvariablen mit N (—4,22; 3,57) sowie die Werte der empiri- 
schen Verteilungsfunktion in den Punkten x;. Diese Werte sind in Tabelle 12.5.1 zusammen- 
gestellt. Der beobachtete Wert d,, der el D, ist gleich dem größten Wert der 
beobachteten Differenzen 


Sn) — Fa| und Ina) — Flz)l- 
Wir erhalten also 

d. = |&n(—5,4) — F(-5,4)| = 0,086 
und ini Hilfe von Tafel VIIL 

P(D, > 0,086) = P(D, Y168 > 1,115) 0,1663. 
Dieser Test führte also nicht zur Ablehnung der Hypothese H,. 


Wir machen den Leser darauf aufmerksam, daß der in diesem Beispiel an- 
gewandte Gedankengang nicht vollkommen exakt ist. GICHMAN [2] hat nämlich 
gezeigt, daß der Satz 10.11.1 nieht erfüllt zu sein braucht, wenn die theoretische 
Verteilungsfunktion von unbekannten Parametern abhängig ist, welche. durch 
Stichproben abgeschätzt werden. Die Ergebnisse, die man in dem betrachteten 
Fall durch Anwendung des Kolmogoroffschen Satzes erhält, sind also mit Vorsicht 
zu betrachten. 

Im Zusammenhang mit Beispiel 12.5.1 drängt sich folgende Bemerkung auf. 
In der Praxis beobachtet man die untersuchten Werte nur mit einer gewissen 
Genauigkeit, die beispielsweise durch die angenommenen Maßeinheiten bedingt 
ist. So.hat man in Beispiel 12.5.1 die Temperatur mit einer Genauigkeit bis zu 
0,1°C gemessen. Infolgedessen wurden die Beobachtungen, die im Intervall 
(2 — 0,05°C, x; + 0,05°C) liegen, im Punkt x, gruppiert. Wie GIcHMmAn [1] 
zeigte, hat die Gruppierung von Beobachtungen einen Einfluß auf den Grenzwert 
der Folge {Q,(A)}. GIcHman hat aber festgestellt, daß man den Kolmogoroffschen 
Satz anwenden kann, wenn die Länge der Gruppierungsintervalle für n — co 
gleichmäßig gegen Null konvergiert. Man kann also den Kolmogorofischen Satz 
dann anwenden, wenn alle Gruppierungsintervalle klein sind. Diese Bemerkung 
gilt auch für den Smirnowschen Satz. 


B. Wir wollen jetzt einen Anpassungstest angeben, der sich auf den Satz 10.11.2 
von SMIRNow stützt. Dieser Satz kann als Grundlage für einen Test dienen, der 
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Tabelle 12.5.1. 
E77 | 


17,8 
—14,1 
—13,4 
—13,2 
—13,0 
—12,2 
—11,6 
—11,3 
—10,9 
—10,1 
9,7 
9,4 
—9,3 
9,2 
9,1 
—9,0 
—87 
8,6 
8,0 
7,8 
1 
7,4 
73 
3 
BR 
7,0 
—6,8 
—6,7 
—6,6 
6,4 
—6,3 
6,1 
—6,0 
5,9 
—5,4 
—5,3 
—5,2 
5,1 
—5,0 
4,9 
4,8 
=47 
4,6 
4,5 
—4,4 
—4,3 


3 
= 


® 


BVRRNNDANTN HE ON OO RO RD I eh DU he Fe be DO DD de de dd Pe ed fh fen Fe Poi 


Sn (2x) 


0,000 
0,006 
0,012 
0,018 
0,024 
0,030 
0,036 
0,042 
0,048 
0,054 


0,060 


0,065 
0,077 
0,095 
0,107 
0,113 
0,119 
0,125 
0,131 
0,136 
0,154 
0,160 
0,178 
0,190 
0,196 
0,202 
0,208 
0,220 
0,232 
0,238 
0,250 
0,255 
0,261 
0,273 
0,285 
0,297 
0,321 
0,333 
0,345 
0,351 
0,363 
0,369 
0,380 
0,392 
0,398 
0,422 


Fa) 


0,000 
0,003 
0,005 
0,006 
0,007 
0,013 
0,019 
0,024 
0,031 
0,049 


. 0,063 


0,074 
0,078 
0,082 


0,085. 


0,090 
0,106 
0,109 
0,145 
0,159 
0,166 
0,187 
0,195 
0,203 
0,209 
0,218 
0,236 
0,245 
0,251 
0,271 
0,281 
0,298 
0,308 
0,319 
0,371 


0,382 


0,394 
0,401 
0,413 
0,425 
0,436 
0,448 
0,456 
0,468 
0,480 
0,492 


—4,2 
—4,1 
—4,0 


—3;8 
—3,6 
—3,5 


33 
232 
23] 
3,0 
2,9 
—2,8 
2,6 
2,5 
2,4 
2,3 
2,1 
—2,0 
—1,9 
44 
—1,6 
—14 
—13 
1,2 
1,1 
—1,0 
0,8 
0,6 
—0,3 
0,2 
01 
0,0 
0,1 
0,3 
0,6 
0,7 
0,9 
1,2 
1,3 
14 
1,6 
1,9 
2,6 
2,8 


F 


BAM BRERURBABMBEDPARDOUBRBHRAENDUNDPBRDSRRAEEUEUDEDUNON U - 


84 (%%) 


0,440 
0,446 
0,464 
0,476 
0,511 
0,523 
0,541 
0,553 
0,559 
0,571 
0,589 
0,595 
0,612 
0,636 
0,660 
0,666 
0,672 
0,690 
0,702 
0,708 
0,731 
0,743 
0,761 
0,773 
0,779 


0,785 


0,809 
0,827 
0,844 
0,856 


0,862 


0,868 
0,892 
0,904 
0,910 
0,916 
0,922 
0,928 
0,946 
0,952 
0,958 
0,969 
0,975 
0,981 
0,987 
0,993 


Far) 


0,504 
0,512 
0,524 
0,536 
0,548 
0,567 
0,579 
0,591 
0,603 
0,614 . 
0,622 
0,633 
0,644 
0,655 
0,674 
0,684 
0,695 
0,705 
0,722 
0,732 
0,742 
0,761 
0,767 
0,785 
0,794 
0,802 
0,808 


0,816 - 


0,832 
0,844 
0,864 
0,871 
0,875 
0,381 
0,887 
0,898 
0,911 
0,916 
0,924 
0,936 
0,939 
0,942 
0,948 
0,956 
0,972 
0,976 
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eine Hypothese 7, nachprüft, daß zwei Proben aus Grundgesamtheiten stammen, 
deren Merkmal X dieselbe stetige Verteilungsfunktion besitzt. Wir betonen, daß 
in der Hypothese H, die Verteilungsfunktion der Gesamtheiten nicht präzisiert 
wird. Mit 8,,,(2) bzw. 8,,,(2) seien die empirischen Verteilungsfunktionen der 
unabhängigen einfachen Stichproben vom Umfang n, bzw. n, bezeichnet. Wenn 
diese Stichproben aus gleichverteilten Gesamtheiten stammen, dann strebt nach 
dem Satz von Smirwow die Folge der Verteilungsfunktionen Q, .,(A), die durch 


j} 
um) = P (Da < a (12.5.4) 
N & 
bestimmt sind, wobei n = tz und 
vn, +% 
Dam: = sup 181m, (@) az Son, (x) | (12.5.5) 


-RO<Ee<o 


gilt, für A>0 mit n— oo gegen die durch die Formel (12.5.3) bestimmte 
Verteilungsfunktion Q (A). 

Gegeben seien zwei einfache Stichproben, die aus zwei Gesamtheiten stammen. 
Wir stellen die Hypothese H, auf, daß das Merkmal X in beiden Gesamtheiten 
dieselbe stetige Verteilungsfunktion besitzt. Ist der beobachtete Wert der Stich- 


wir die Hypothese H, ab. ” > 


probenfunktion D, „, größer oder gleich rs, wobei Q(A,) =1— « ist, so lehnen 


Beispiel 12.5.2. Im Beispiel 12.3.4 betrachteten wir den durchschnittlichen Brotverbrauch 
pro Normalverbraucher in zwei Stichproben. In der einen befanden sich n, = 65 Arbeiter- 
familien aus Warschau und Lödz, in der anderen n, = 57 Arbeiterfamilien aus dem ober- 
schlesischen Industriegebiet. Wir haben festgestellt, daß bei Anwendung eines Parameter- 
testes mit der Sicherheitswahrscheinlichkeit & = 0,05 kein Grund besteht, die Hypothese 
H, abzulehnen, nach welcher der durchschnittliche Roggenbrotverbrauch für Arbeiter- 
familien in Warschau und Lödz sowie im oberschlesischen Industriegebiet der gleiche ist. 
Wir wollen jetzt die weit stärkere Hypothese nachprüfen, nach der nicht nur der durch- 
schnittliche Verbrauch,. sondern auch die Verteilung der Arbeiterfamilien hinsichtlich des 
Roggenbrotverbrauches in Warschau und: LödZ. sowie im oberschlesischen Industriegebiet 
die gleichen sind. Wir wollen also die Hypothese H, prüfen, nach welcher beide Stichproben 
aus Gesamtheiten mit gleicher Verteilung erhoben wurden. 

In Tabelle 12.5.2 ist mit =, der monatliche Brotverbrauch pro Normalverbraucher be- 
zeichnet. Die Zahlen n, bedeuten die Anzahl der Familien, deren Brotverbrauch x; beträgt, 
: während s,„,(2,) und 8.,,(%,) die empirischen Verteilungswerte beider Stichproben in den 
Punkten x; bedeuten. Der Tabelle 12.5.2 entnehmen wir 


Ann, = max ISın, (2) — $2n,(%)| = 0,105. 
E7 i 
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Tabelle 12.5.2. 


N 
% Warschau oberschles. s1n, (%k) San.) | Tsın.(&) — Sanz(&e) | 
Lödz Industr.-Geb. 
1 0 4 0,000 0,000 0,000 
2 0 2 0,000 0,070 0,070 
3 3 1 0,000 0,108 0,105 
4 2 i 0,046 0,123 0,077 
5 3 2 0,077 0,140 0,063 . 
6 65] 4 0,123 0,175 . 0,052 
7 7 5 0,200 0,246 0,046 
8 5 6° 0,308 0,333 0,025 
9 9 7 0,384 0,439 0,055 
10 8 2 0,523 0,561 0,038 
11 5 3 0,645 0,596 0,049 
12 ö 3 0,723 0,649 : 0,074 
13 0 1 0,800 0,702 0,098 
14 1 4 0,800 0,719 0,081 
15 2 0 0,815 0,789 0,026 
16 1 4 0,846 0,789 0,057 
17 6 en; 0,861 0,860 0,001 
18 1 1) 0,954 - 0,895 0,059 
20 2 1 0,969 0,895 0,074 
22 0 1 1,000 0,912 0,088 
23 0 3 1,000 0,930 0,070 
24 0 1 1,000 0,982 0,018 
>24 0 0 1,000 . 1,000 0,000 
NıNz 
Wegen n = ——— = 30,37 folgt aus Tafel VIII 
N +, 


P(Dan, Z 9105) = P(Dym, y30,37 > 0,58) » 0,8896. 
Der angewandte A-Test gibt also keine Handhabe, die Hypothese abzulehnen. 


Beispiel 12.5.3. Aus drei Gesamtheiten, in denen das Merkmal X stetige Verteilungs- 
funktionen hat, hat man je eine einfache Stichprobe zu rn, = 100, rn, = 150 und n; = 200 
Elementen erhoben. Zweck dieser Probeuntersuchung ist es, die Hypothese H, nachzuprüfen, 
nach der X in allen drei Gesamtheiten dieselbe Verteilung hat. Für die Stichprobenfunktion 
D;(N,, n;;,) hat man die durch die Formeln (10.13.14) bestimmten Werte 


Hd (N 1,02) = 0,20, 
de (N...) = 0,17 


beobachtet. Wir prüfen die Hypothese H, mit der Sicherheitswahrscheinlichkeit & = 0,05. 
Wir haben j 


100 - 150 250 - 200 
—— :02= 1,55, —— 017 = 1,79. 
250 450 
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Da 1,79 die größere der beobachteten Zahlen ist, erhalten wir nach Satz 10.13.2 für große 
Stichproben die Näherungsgleichung 


Ninız . 
P | max N D(N, u) 2 179) » 1 — [9(1,79)]. 


1SiS2% ‘+1 


Auf Grund von Tafel VIII ist diese Wahrscheinlichkeit gleich 0,0066. Wir lehnen also die 
Hypothese H, ab. 


12.6. Die Tests von Wald-Wolfowitz und Wileoxon-Mann-Whitney 


A. Warp und WoLrowırz [1] konstruierten ein scharfsinniges Prüfverfahren für 
die Hypothese, daß zwei Stichproben aus Gesamtheiten mit der gleichen Ver-- 


-teilung stammen. Dieser Test hat als Grundlage die Iterationstheorie, die im vor- 


hergehenden Kapitel besprochen wurde. 

Es seien 2, l =1,...,n,) und 2, (7 =1,...,n,) zwei unabhängige einfache 
Stichproben, die aus zwei Gesamtheiten ausgelost wurden, in denen das Merkmal X 
eine stetige Verteilungsfunktion besitzt. Wegen 


PX, == Kr =0) = PX, — Ay =0)= P(X, 2 Ay = 0) =J 


können wir annehmen, daß 


2 Fr EN u eg ehem: j=l...,n) 


gilt. Wir ordnen die Werte x,, und x,; der Größe nach an, d. h., wir bilden aus den 
Elementen x,, und x,; die Folge „(m =1, ....,n, + N), wobei 


2% <<< an (12.6.1) 


ist. Danach ordnen wir denjenigen 2„, die aus der ersten Stichprobe stammen, die 
Zahl 0 und den übrigen z,, die Zahl 1 zu. So erhalten wir eine Null-Eins-Folge, die 
nr, Nullen und r, Einsen enthält. Ist die Hypothese H,, daß beide Stichproben 
aus Gesamtheiten mit der gleichen Verteilung stammen, richtig, so treten alle 
Gruppen, die aus rn, Nullen und aus n, Einsen bestehen, mit der gleichen Wahr- 
scheinlichkeit auf. Man kann also die Iterationstheorie verwenden, um die Hypo- 
these H, zu testen. 

Wir müssen uns noch überlegen, welche Schlüsse wir bei Anwendung der 
Iterationstheorie zu ziehen haben. Schon von vornherein neigen wir dazu, die 
Hypothese Z, abzulehnen, wenn es sich zeigt, daß die Anzahl der beobachteten 
Iterationen im Verhältnis zur erwarteten Anzahl klein ist; es treten dann nämlich 
lange Iterationen auf, die Elemente der einzelnen Stichproben bilden große 
Häufungen, und das zeugt davon, daß das Merkmal X nicht in beiden Gesamt- 
heiten gleich verteilt ist. Mit anderen Worten, je größer die Anzahl der Iterationen 
ist und je kürzer die einzelnen Iterationen sind, desto stärker bezeugt die Stich- 
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probe die Richtigkeit der Hypothese H,. Der Anpassungstest besteht hier also 
darin, einen Wert k, zu finden, für den P(XKsk)=x« ist, wobei & die Sicher- 
heitswahrscheinlichkeit bedeutet, und die zu verifizierende Hypothese 4, abzu- 
lehnen, wenn das beobachtete k höchstens gleich k, ist. 


Beispiel 12.6.1. Um die Hypothese H,, daß das Merkmal X die gleiche stetige Verteilung 
in zwei Gesamtheiten besitzt, zu verifizieren, entnahm man diesen Gesamtheiten zwei un- 
abhängige einfache Stichproben, jede vom Umfang 4. Man erhielt die Werte 


&ı=3; % = 3,5, %s = 6,5, %ı = 2,5, 
% =T, %gg = 2,9, %g = 4,0, %yı = 6,0. 


; 


Die z-Werte sind hier 
2, = 2,5, 2, = 2,9, 2 = 3, 4 = 35; 
„= 4, 256, 2%, = 6,5, 3 =1. 
Wir erhalten also die Null-Eins-Folge 
01001101. 


Wenn wir die Bezeichnungen aus Kapitel 11 benutzen, haben wir 


kıı = 2, kıs =1, kys = ka =, 
kogı = 2, kos =1, koog == hoga =0, 
kh =l,=3, k=6. 


Wir beachten, daß die Umfänge der einzelnen Stichproben hier keine Zufallsvariablen dar- 
stellen. Um die gesuchten Wahrscheinlichkeiten zu berechnen, benutzen wir die Formeln 
(11.3.12) und erhalten 


P(K=2|N,=4, N, = 4) = 0,029, 
P(K=3|N,=4, N, = 4) = 0,086. 


Wenn wir die Hypothese H, mit der Sicherheitswahrscheinlichkeit & = 0,05 testen, finden 
wir, daß der kritische Wert hier k, = 2 beträgt. Da wir k = 6 beobachtet haben, besteht 
kein Grund, die Hypothese H, abzulehnen. Wir bemerken auch,- daß nach Formel (11.4.4) 
der Mittelwert E(K|N,=4, N, = 4) gleich 5, also beinahe gleich dem beobachteten Wert 
von & ist. 


B. Ein anderer nichtparametrischer Test, der viele Anwendungen findet, wurde von 
WiLcoxon [1] sowie von Mann und WHrrtney [1] konstruiert. 
Es seien X, und X, unabhängige Variable, und es sei die Verteilungsfunktion 
F;(x) der Zufallsvariablen X,(# = 1,2) stetig. Zunächst wollen wir annehmen, 
daß für jedes reelle x die Gleichung F,(x) = F,(x) gilt. Ferner mögen die x,, 
=1,2,...,n,) und 2; =1,2,...,n,) sowie die y„ (m =1,2,...,n, +) 
die gleiche Bedeutung haben wie in 12.6.A. 


n 
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Wir wollen berechnen, wieviel Nullen der Null-Eins-Folge {y„} auf jede Eins 
folgen, und dann die Summe dieser Anzahlen bestimmen. Diese Summe bezeichnen 
wir mit , d.h., « ist die Anzahl der Paare (&,,, 2,,), für die die Ungleichung 
%; = u: gilt. Das ist der beobachtete Wert der Mann- = hitneyschen Stichproben- 
funktion U. 

Die Bestimmung der exakten Verteilung der Stichprobenfunktion U ist äußerst 
mühevoll. Gestützt auf die Rekursionsformel, die wir nachstehend herleiten wollen, 
haben MAnn und WHITNEY [1]eine Tafel.der Verteilung der Stichprobenfunktion U 
für den Fall n, <n,<S8 erarbeitet. 

Wir bezeichnen mit ?,.,(4) bzw. 2,n,(%) die Anzahl solcher Folgen aus N, 
Nullen und rn, Einsen, in denen jede Eins w Nullen vorausgeht, bzw. die Wahrschein- 
lichkeit für das Auftreten einer solchen ne Die Gesamtheit aller Folgen aus 


a 


n, Nullen und n, Einsen beträgt ‚ und jede Folge tritt: mit der gleichen 


Wahrscheinlichkeit auf. Es gilt daher. die Beziehung 


n,!nz! 


Prans (U) = 
Wir stellen fest, daß 7,,.. (u) der rekursiven Beziehung 


Pain, (u) = Prn-ı,n, (w—n)+ Daym-ı (v) (12.6.3) 


genügt, wobei 
Pam (a) =0 für u<O oder u> nn 


gilt. Die Gleichung (12.6.3) läßt sich wie folgt verifizieren: Wir unterteilen die 
betrachteten Folgen in zwei Gruppen. Die erste Gruppe besteht aus den Folgen, 
bei denen rechts an der letzten Stelle eine Null steht, die zweite aus denen, bei 
denen an der gleichen Stelle eine Eins steht. 

Wir bezeichnen mit A, „, (u) bzw. B,„. (4) die Anzahl der Folgen der ersten bzw. 
der zweiten Gruppe, in denen die Einsen u Nullen vorausgehen. Wir haben dann 


Pam, (%) + Ann, (%) + Ban, (%)- (12.6.4) 
Nun tilgen wir in den Folgen der ersten Gruppe die letzte Null. Diese Folgen 
enthalten jetzt je #, — 1 Nullen und je n, Einsen, und jede Eins geht nunmehr 


einer Null weniger voraus als in der ursprünglichen Folge dieser Gruppe. Unter 
Beachtung der Tatsache, daß n, Einsen vorhanden sind, erhalten wir somit 


. Ann (U) = Buy-ın, (uU — 2). (12.6.5) 


12.6. Die Tests von WaLp-WoLFowITz und WILCOxox-MANN-WHITNEY 525 


Nun tilgen wir in den Folgen der zweiten Gruppe die letzten Einsen. Diese Folgen 
haben dann jeweils », Nullen und 2, — 1 Einsen. Da die Tilgung der Einsen an der 
letzten Stelle rechts den Wert % nicht beeinflußt, haben wir 


Bam (U) = Paumı (U). (12.6.6) 


Aus (12.6.4) bis (12.6.6) erhalten wir nun die Beziehung (12.6.3). 

Sodann leiten wir unter Anwendung einer von van DAntzie [1] eingeführten 
Methode die Formeln für E(U) und D?(U) her, wobei wir nicht voraussetzen, daß 
F,(«) = F,(x) ist. 

Wir setzen 

p=P(X,—- X, <0)=-P(X,— X,=0). (12.6.7) 


Aus (6.5.7) folgt 
p = [Fela) dF,(@). (12.6.8) 


Wir definieren die Funktionen g(z) und £,, auf folgende Weise: 


1 für z>0 j 
= > 12.6.9 
> | 0 für 2<0, 


eg) Melb..,m; j=h...,n). (12.6.9) 


Es ist somit &; =1, wobei x, > u; ist; hieraus folgt, daß sich die Mann- 
Whitneysche Stichprobenfunktion U in der Form 


V- 8 (12.6.10) 


schreiben läßt. Aus (12.6.7) und (12.6.9’) erhalten wir 

Ei,)=Ei)=P. (12.6.1) 
Da £,; und &,, für Z=#1, und j=+j, unabhängig sind, ergibt sich 

Eis, )=P (Hl,je#j). (12.6.12) 


Nunmehr setzen wir 


(Fy(&) — PP EF,(e), (12.6.13) 


= [(F@W)—- (1 - PP dr,ß). (12.6.14) 
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Nun sei j=#+j,. Das Produkt £,,£,,, ist dann und nur dann gleich 1, wenn die 
Konjunktion (2; — u <O und 2, — u <0) erfüllt ist, während im ent- 
gegengesetzten Fall &,;&,, —0 ist. Wir ermitteln die Wahrscheinlichkeit für die 
Gültigkeit dieser Konjunktion. Zunächst gilt 


PXy3< X, %y, <Xy) = f | ii dF, o) dF,(2) = f (F.@))? Ed, (x). 


x oo 0% 


Wie man aus (12.6.8) und (12.6.13) erkennt, ist das Integral auf der rechten Seite 
der letzten Gleichung gleich y? + 22, woraus 


Bey) +P (=) (12.6.15) 

folgt. Analog erhalten wir | 
Eess)sP+mM (sh). (12.6.16) 

Aus den Beziehungen (12.6.10) bis (12.6.12) sowie aus (12.6.15) und (12.6.16) 


folgt 
EU) =nnP, (12.6.17) 


E(U?) -3 5 B3 5 E(Eyö) = Nınalp + (m — 1)(y? + PP) 


=1 bh=1 je1 hl 


+m-D®+P)+m 1) m — NP). 


Hieraus und aus (12.6.11) erhalten wir 


DE(U) = nınz((n — Yp® + ln — My? + pl pP). (12.6.18) 


Für F,(@)= F,(«) erhalten wir durch partielle Integration in (12.6.8), (12.6.13) 
und (12.6.14) 


Aus (12.6.17) und (12.6.18) ergibt sich dann 
1 : 1 
EU) = Ss NN, D2(U) = m NNo(nı + Ne +1). (12.6.19) 


Nun betrachten wir die Stichprobenfunktion 


U-E({U) 


V ee 
YD:(d) 


(12.6.20) 
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MANN und WaItney [1] haben für den Spezialfall F,(x) = F,(x) bewiesen, daß 
für 2, — oo und n, — oo die Stichprobenfunktion V die asymptotische Normal- 
verteilung N (0;1) hat. LEuMmAnN [2] bewies das gleiche für den allgemeinen Fall, 


d.h. für F,(@2)=Fy,(x), jedoch nur dann, wenn 0 <p<1 sowie N 5 


(s >0) und 2,— oo ist, “A 

Die Tabellen von Man und WHITNEY [1] zeigen, daß für F, (x) = F,(r) die 
Approximation bereits für n, = N, = 8 ausreichend genau ist. 

Wir. wollen nun einen Test behandeln, der auf der Verteilung der Stichproben- 
funktion U beruht. Zu diesem Zweck führen wir die folgende Definition ein: 


Definition 12.6.1. Die Zufallsvariable X; (# = 1,2) möge die Verteilungs- 
funktion F;(x) haben. Wir sagen, daß die Zufallsvariable X, stochastisch größer als 
X, ist, wenn für jedes reelle x, für das 0 < F,(x) <1 gilt, die Ungleichung 


Fl) > F,(«) (12.6.21) 


erfüllt ist. 

Wir wollen nun annehmen, daß wir zwei Zufallsvariable X, und X, vorliegen 
haben und feststellen wollen, ob X, stochastisch größer ist als X,. Wir setzen die 
Hypothese H, voraus, derzufolge die Gleichung F,(x) = F,;(x) für jedes reelle 
x erfüllt ist. Diese Hypothese verifizieren wir mit Hilfe der Mann-Whitneyschen 
Stichprobenfunktion U. auf folgende Weise: Wir greifen aus der i-ten Gesamtheit 
(= 1,2) eine n;-gliedrige Stichprobe heraus. Ferner nehmen wir an, daß n, und 
", nicht größer sind als 8. Wir bestimmen aus der Tabelle von MANN und WHITNEY 
[1] den Wert u, derart, daß bei Gültigkeit der Hypothese Z, die Beziehung 
P(U<w)<x erfüllt ist, wobei & die angenommene Sicherheitswahrscheinlich- 
keit ist. Sodann bestimmen wir aus den gewonnenen Stichproben den Wert uw der 
Stichprobenfunktion U. Ist hierbei v<u,, so lassen wir die Hypothese H, 
fallen, denn die Tatsache, daß die Anzahl der beobachteten Paare (x,,, 2;), für die 
%; <&%u gilt, klein ist, deutet anscheinend darauf hin, daß in der Tat die Zufalls- 
variable X, stochastisch größer ist als X. 

Wenn n, und n, größer sind als 8, verwenden wir die Normalapproximation, 
d.h., wir berechnen den beobachteten Wert v der Stichprobenfunktion V, die 
durch (12.6.20) gegeben ist, wobei wir E(U) und D2(U) aus den Formeln (12.6.19) 
bestimmen, und lassen die Hypothese H, fallen, wenn v<v, ist; hierbei ist 
®(v,)=« und « die Sicherheitswahrscheinlichkeit. 


Beispiel 12.6.2. Die Tabelle 12.6.1 gibt in acres (1 acre = 0,40468 ha) für 34 Dörfer 
des Gebietes von Laknau (Lucknow) in Indien die Flächen an, die in den Sommern 1936 
und 1937 mit Weizen bebaut wurden. Die Hypothese, die wir testen wollen, möge darin 
bestehen, daß die Variable „Weizenfläche‘‘ in den Sommern 1936 und 1937 die gleiche Ver- 
teilung hat. Wir wenden den Test von MANN-WHITNEY zur Verifizierung dieser Hypothese 
an. Aus der Tabelle 12.6.1 erhalten wir, nach Ordnung der Zahlen x,, und x,,, wenn wir den 
Beobachtungen aus dem Jahre 1936 die Zahl Null und den Beobachtungen aus dem Jahre 
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1937 die Zahl Eins zuordnen, die Ziffernfolge (Null-Eins-Folge) 
{47} = 01101101000001110110110111000010011101001100010001111011011000110010. 


MIND LE nal, 
34.34.69 17/23 
12 
Wegen ®(0,221) » 0,5875 liegt kein Grund vor, die getestete Hypothese zu verwerfen. 
Wir weisen darauf hin, daß in der Tabelle 12.6.1 manche Zahlen mehrfach auftreten. 
Das liegt daran, daß die beobachteten Werte mit einer Genauigkeit bis zu einem halben acre 
angegeben wurden. 


Hieraus erhalten wir vu = 596 und v = 


Tabelle 12.6.1. 


Nummer 1936 1937 Nummer 1936 1937 
des Dorfes Zu %aj des Dorfes u % 
1 75 52 18 45 27 

2 163 149 19 564 515 

3 326 289 20 238 249 

4 442 381 21 92 85 

5 254 278 22 247 221 

6 125 111 23 134 133 

7 559 634 24 131 144 

8 254 278 25 129 103 

9 101 112 26 192 179 

10 359 355 27 663 330 

11 109 99 28 236 219 

12 481 498 29 73 62 

13 125 ill 30 62 79 

14 5 6 3 71 60 

15 427 399 32 137 100 

16 78 79 33 196 141 

17 78 105 34 255 265 


Die Zahlenwerte für dieses Beispiel sind dem Buch von SURHATME [3] entnommen. 
Auf den Test von Mann-WaITNEY werden wir noch einmal im Kapitel 16 zurückkommen. 


Wırcoxon [1] betrachtete für 2, = n, früher als Mann und Warrney, eine 
Stichprobenfunktion, diemitderMann-Whitneyschen StichprobenfunktionU linear 


1 
verknüpft ist, und zwar die Stichprobenfunktion S = 2 2m na +1) —- U. 


Aus diesem Grunde findet man in der Literatur für den betrachteten Test auch 
häufig die Bezeichnung Test von WILCoxon-MANN-WHITNEY. Wir weisen dar- 
auf hin, dB S=m tm +: + m,, gilt, wobei die m, (r=1,2,...,n,) die 
Ränge derjenigen y„ sind, die den Elementen %,; entsprechen. 
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Die Sicherheitswahrscheinlichkeiten für den Test von WıLcoxon-MAnx- 
. WEHITNEY wurden von Fix und Hovezs [1] angegeben. 

Die Verallgemeinerung dieses Tests auf den Fall von k Stichproben (k >2) 
gehen auf KrvskAar [1], RisKoorRrt [1] und PraxzaAeu [1] zurück. 


C. Die Theorie der nichtparametrischen Tests hat sich in den letzten Jahren sehr 
stark entwickelt. Fraser [1] widmete dieser Theorie eine.umfangreiche Mono- 
graphie. Ferner seien hier auch die Arbeiten von WoLrowırz [4], GIcHMas, 
GNEDENKO und SMIRNOW [1] sowie SCHMETTERER [3] erwähnt, die viele wichtige 
Informationen über neue Untersuchungen auf diesem Gebiet enthalten. 

Neben den rein parametrischen und den rein nichtparametrischen Tests wer- 
den in der Literatur Tests gemischter Natur betrachtet, und zwar Tests, bei denen 
die Funkticnsform der Verteilungsfunktion als unbekannt angesehen wird, 
doch ist der Gegenstand der zu testenden Hypothese nicht die Funktionsform 
der Verteilungsfunktion, sondern der Vergleich der Werte der unbekannten Para.. 
meter mehrerer Grundgesamtheiten. Solche Tests, die die Erwartungswerte und 
Varianzen mehrerer Grundgesamtheiten mit unbekannten Verteilungsfunktionen 
betreffen, wurden von MosTELLER [1], SApowskı [1], RosewgAum [1] sowie 
LuKASZEwICZ und SADoWwskI [1] angegeben. (PAuLsox [1] betrachtete ähnliche 
Probleme für mehrere normale Gesamtheiten.) : 


12.7. Unabhängigkeitstests in Kontingenztafeln 


Wir stellen uns vor, daß die Elemente einer Stichprobe im Hinblick auf zwei 
Merkmale X und Y klassifiziert wurden. Dabei wurde der Bereich der möglichen 
Werte der Merkmale in r bzw. s Gruppen aufgeteilt. Wir bezeichnen mit n den 
Umfang der Stichprobe, mit r;, die Anzahl der Elemente, welche zur i-ten 
@=1,2,..., r) Gruppe hinsichtlich des Merkmals X und zur k-ten (k=1,2,...,s) 
Gruppe hinsichtlich des Merkmals Y gehören. Weiter setzen wir 


N. = IN, (12.7.1) 
k=1 
Tr 

N. > t- (12.7.2) 
i=1 


Selbstverständlich gilt die Gleichung 


=. 


8 
n = nr 
k=1 


i=1 


Die so klassifizierten Stichprobenelemente stellen wir in Tabelle 12.7.1 dar 
(Kontingenztafel). 


34 Fisz 
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Tabelle 12.7.1. 


k zusammen 

. 1 2 8 i 
v N 

1 Rıı Rıa Nıs N 

2 Nig1 Ra Ngs Ng 

Y Ayı ya Nırs N, 
zusammen 

N Ma ig n 
Rep 


Wir stellen die Hypothese HZ, auf, daß in der Gesamtheit, aus der die betrach- 
tete Stichprobe stammt, die Merkmale X und Y unabhängig sind. Wenn wir mit 
Pır die Wahrscheinlichkeit dafür bezeichnen, daß ein aufs Geratewohl aus der 
Gesamtheit herausgegriffenes Element zur ö-ten Gruppe hinsichtlich des Merkmals 
X und zur k-ten. Gruppe hinsichtlich des Merkmals Y gehört, und mit p,. und 
?., die entsprechenden Randwahrscheinlichkeiten, dann ist nach Hypothese HZ, 
für jedes Paar (t, k) 


Pix = Pi: Pr (12.7.3) 
wobei 
Tr Ss 
LP. = Ipami1 (12.7.4) 
i=1 k=] 


gilt. Die so formulierte Hypothese 7, präzisiert nicht die Werte der r-+s un- 
bekannten Parameter, d. h. die Werte ?., und 9;.. Da man zwei von ihnen aus den 
Formeln (12.7.4) bestimmen kann, bleibennoch r + s — 2 Parameter unbekannt. 
Um zur Verifikation der Hypothese H, einen z7?-Test benutzen zu können, be- 
stimmen wir die unbekannten Parameter nach dem Maximum-Likelihood- En 
aus der Stichprobe. Es gilt 


r 8 


L= HM Ip = BEN, IX P: »- -i In Mir pr. 


i=1 k=1 i=1 k=1 i=1 k 


Unter Berücksichtigung der Bezeichnungen (12.7.1) und (12.7.2) erhalten wir 
r 8 ; 
L= II»: Ile. 
il ke 
Aus den Gleichungen (12.7.4) bestimmen wir p,. und 2..: 


r—1 
m.=-1-NP:, 


i==1 


s-1 
pP, = 1— Pr: 
k=]1 


12.7. Unabhängigkeitstests in Kontingenztafeln 


Daraus erhalten wir 


n. r—1 


r—1 Nr. s—1 s—1 
L= ( = Sn.) ( = Sr.) II IIpi 
i=1 k=1l i=1 k=1 


und 
r—1 u 
logL = arg 1 _ > + n., log ( _ Zr.) 
i=1 k=1 
r—1 s— 


+ In. log pi. + 
i k 


1 
N. 108 P.r. 
=1 


Wir haben somit das Gleichungssystem 


ölog . _ Ri u Air: 
Se Le N 
pi. 1— Y 2. Pi Pi Pr 
i=1 
ölogL ae er ER (k=1,2, 
e = 5 
p k 1 Bu Y pr p k p k p 
k=1 
Setzen wir 
4A = bi e B = ze > 
Pr- P-s 


so ergibt sich 


R;. 
= : i=1,2, 
p = ( r) 
ee (k=1,2,...,8). 


Aus der Gleichung (12.7.4) erhalten wir 


i=1 ä N 
i- 1, 
u a 
$ 
5 In. 
k=1 
= =—=el 
Suse: Ä 
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alsoit A=B=n. Endgültig ergibt sich 


z (k=1,2,...,8). (12.7.5) 


N. Tr 
708 (ru zu N 
2=nY N R (12.7.6) 


Da wir aus der Stichprobe r + s — 2 Parameter bestimmt haben, ergibt sich 
nach dem Fisherschen Satz (siehe 12.4), daß die durch (12.7.6) bestimmte Zu- 
fallsvariable 2? in Aunaherng eine 42-Verteilung mit 


ee ee 


Freiheitsgraden hat. Folglich können wir einen %2-Test zum Nachprüfen der 
Hypothese H, benutzen, die die Unabhängigkeit der Variablen X und Y be- 
hauptet. | 

Wenn r=s = 2 ist, nennen wir die Kontingenztafel Tabelle 12.7.1 vierteilig. Die 
Formel für x? hat hier die Gestalt 


2 ” (NN — Marz)" . (12.7.7) 


N,.Ng.N.1N.2 


Beispiel 12.7.1. Wir stellen die Hypothese H, auf, daß bei Männern die Augenfarbe X 
und die Haarfarbe Y voneinander unabhängige Merkmale sind. Diese Hypothese wollen 
wir nachprüfen, indem wir die Augen- und Haarfarbe an 6800 Männern untersuchen und die 


Tabelle 12.7.2. 


k (Haar) 2 
1 (dünkel. 3 4 zusammen 
ö (Augen) (hellblond) blond) (schwarz) (rot) N. 
n | ; 
(blau) 1768 807 189 47 2811 
2 
. (grau oder grün) - 946 1387 746 53 3132 
: j 
(braun) 115 438 288 16 857 


zusammen %., 2829 2632 1223 16 6800 
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Angaben in Tabelle 12.7.2 zusammenstellen, die aus M. G. Kexnauu [1] entnommen wurde. 
Die Stichprobe teilen wir hinsichtlich der Augenfarbe in drei und hinsichtlich der Haarfarbe 
in vier Gruppen ein. Aus Tabelle 12.7.2 berechnen wir 


| N Ne 

sa \ #7 6800 

22 = 68003) I — 1075,2 
i=1 k=1 NN 


Die Anzahl der Freiheitsgrade beträgt (r — 1)(s —1)=2-3=6. In den Tafeln der ya 
Verteilung finden wir, daß für sechs Freiheitsgrade P(x? = 1075,2) < 0,000001 ist. Wir 
lehnen deshalb die Hypothese H, ab. 


12.8. Aufgaben und Ergänzungen 


1. In zwei einfachen Stichproben aus zwei normalen Gesamtheiten mit den Verteilungen 
N (0;0,) und N (0; 03), wobei o, und o, unbekannt sind, wurde , =1 und, =3 be- 
obachtet. Die Stichprobenumfänge waren n,=9 bzw. n,= 7. Mit der Sicherheitswahr- 
scheinlichkeit & = 0,02 teste man die Hypothesen 


1 
a) H,(, =0,=1), b) H,(o, = 1, 0,=2) und c)H, (a ir 5,= ). 


Hinweis. Man verwende die Aufgabe 9.12.7. 


2. In einer siebengliedrigen einfachen Stichprobe aus einer normalen dreidimensionalen 
Grundgesamtheit wurden die folgenden Werte für die Stichprobenkorrelationskoeffizienten 
ermittelt: 735 = 0,2, 713 = 0,4, Tas = —0,35. Man teste für die Sicherheitswahrschein- 
lichkeit & = 0,05 die Hypothese Hy, (012 = 013 = (3 = 0). 
Hinweis. Man verwende die Aufgabe 9.12.10. 


3. In einer einfachen sechsgliedrigen Stichprobe aus einer dreidimensionalen normalen 
Gesamtheit hat sich der partielle Korrelationskoeffizient 772.3 = 0,26 ergeben. Mit der 
Sicherheitswahrscheinlichkeit & = 0,05 teste man die Hypothese, daß der partielle 
Korrelationskoeffizient 019.3 der Grundgesamtheit gleich Null ist. 


Hinweis. Man verwende die Aufgabe 9.12.12. 


4. Bei einer einfachen zehngliedrigen Stichprobe aus einer vierdimensionalen normalen Ge- 
samtheit .ergab sich rs.) = 0,3. Widerspricht dieses Ergebnis bei der Sicherheits- 
wahrscheinlichkeit & = 0,01 der Hypothese, daß gs = 213 = O4 = 095 = 9 = 0 ist? 


Hinweis. Man verwende die Aufgabe 9.12.13. 


5. Bei der Beobachtung einer dünnen Schicht einer Goldlösung registrierte SVEDBERG 
in gleichen Zeitintervallen die Anzahl der Goldpartikeln im Mikroskopfeld. In folgender 
Tabelle bezeichnet n; die Anzahl der Zeitintervalle, in denen SvEDBERG 5 Goldpartikeln 
registrierte. Man fasse n, als Werte der Zufallsvariablen N auf und überprüfe mit der 
Sicherheitswahrscheinlichkeit « = 0,01 die Hypothese, daß N die Poissonsche Verteilung 
mit dem Parameter A hat, wobei } gleich der beobachteten mittleren Anzahl der Par- 
tikeln in einem Zeitintervall ist. 
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j | 0 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | insgesamt 
„le lıee|eol|l ee | a | 5 JıJlal 
Man zeige, daß die durch die Formel (12.4.2) definierte Stichprobenfunktion x? die Momente 
u A—(R42r—2 
Bari, Diez 4 Ltr 
n 
i u F 1 
hat, wobei A = >: — ist. Insbesondere gilt für „= — (k=1,2,...,r) 
k=1 Tr r 
Dali) = 2(r -D)(r —1) 
n 


. In der Formel (12.4.2) möge r für n —oo über alle Grenzen wachsen. Man beweise: 


Gilt hierbei 


im min an =w,. 
no 1ISksr 


so besitzt die Stichprobenfunktion (y? — r)/V2r die asymptotische Normalverteilung 
N (0;1) (Tumansan [1], Verallgemeinerung durch GicHMmar [4]). 


. An zehn Männern wurden Messungen des Kniesehnenreflexes unter zwei verschiedenen 


Bedingungen I und II vorgenommen. Im ersten Fall (IT) hatte die Versuchsperson un- 
mittelbar vor dem Schlag mit dem Reflexhammer ein Handdynamometer zusammen- 
zupressen. Im zweiten Fall (II) wurde der Kniesehnenreflex im entspannten Zustand 
erregt. Die Größe der Reflexbewegung in Grad gemessen gibt die nachstehende Tabelle 
an (nach GUILFORD [1]): 


a |#e|»| oo | | slae|v | alla 


Unter Verwendung des Tests von Mans-WEItney mit der Sicherheitswahrscheinlichkeit 
& = 0,05 überprüfe man, ob der Knieausschlag unter den Bedingungen I und II die 
gleiche Verteilung hat. 


. Jedes Element einer Grundgesamtheit vom Umfang N kann a) die Eigenschaft A und die 


Eigenschaft B haben, b) die Eigenschaft A besitzen, die Eigenschaft B hingegen nicht, 
c) die Eigenschaft A nicht aufweisen, dagegen jedoch die Eigenschaft B, d) weder die 
Eigenschaft A noch die Eigenschaft B besitzen. Die entsprechenden Elementanzahlen 
in den einzelnen Gruppen seien N, Nj2, N; und N,. Der Ausdruck 


ge N Nge — N12N a1 
NyıNaa + NieNzı 
heißt der Assoziationskoeffizient (Yuue [1], [2]). 
Wir wollen das Aufweisen der Eigenschaft A als zufälliges Ereignis A und das Aufweisen 
der Eigenschaft B als zufälliges Ereignis B deuten. Man beweise, daß q bei Unabhängigkeit 


der zufälligen Ereignisse A und B gleich 0 ist. Wie sind dieFälle g=1 und = —1 zu 
deuten? : . 
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10. 


11. 


(Fortsetzung). In n-gliedrigen einfachen Stichproben aus der in Aufgabe 9 betrachteten 
Gesamtheit erhalten wir 2,7, %ı2 Ngı bZW. 2g, Elemente der einzelnen Kategorien. Der 
Assoziationskoeffizient der Stichprobe hat die Form 
__ Pıı a2 — NRız Rpı 
Nyy Rap -F Nı2 Mar 


Man zeige, daß dann 


gilt. 


Man bestimme den Assoziationskoeffizienten für eine Stichprobe, die den Zusammenhang 
zwischen der Choleraimpfung und der Morbidität ermitteln sollte, aus der nachstehenden 


Tabelle (GREENwooD und YULE [1)): 


nicht erkrankt erkrankt insgesamt 
geimpft 276 3 279 
nicht geimpft 413 66 539 
insgesamt 749 69 818 


Man berechne D2($) durch Einsetzen der beobachteten Anzahlen anstelle der theo- 


retischen. 


13. THEORIE DER SCHÄTZFUNKTIONEN 


13.1.  Einleitende Bemerkungen 


In 12.4 und 12.7 waren wir schon auf die Frage nach der Abschätzung unbekann- 
ter Parameter einer Gesamtheit auf Grund von Stichprobenergebnissen gestoßen 
und hatten eine Methode kennengelernt, die diese Abschätzungen gewährleistet. 
Die allgemeine Theorie, ‚die sich mit dieser Problemstellung befaßt, nennt man 
Schätztheorie. 

Um einen unbekannten Parameter Q auf Grund von Stichprobenergebnissen 
abschätzen zu können, geht man folgendermaßen vor. Man berechnet aus der 
Stichprobe den Wert u einer gewissen Stichprobenfunktion U, deren Verteilung 
von diesem Parameter Q abhängt, und nimmt diesen Wert « als Abschätzung des 
unbekannten Parameters Q. Wir sprechen dann von einer Punktschätzung. Die 
Stichprobenfunktion U sowie ihren. beobachteten Wert % bezeichnen wir als 
Schätzfunktion des unbekannten Parameters. Gewöhnlich geht es aus dem Text 
hervor, ob der Terminus Schätzfunktion sich auf U oder auf u bezieht. 

Man kann desgleichen nach gewissen Intervallen suchen, die den unbekannten 
Parameter enthalten. In diesem Fall sprechen wir von einer Intervallschätzung. 

Wir beginnen die speziellen Betrachtungen mit einer Klassifikation der 
Schätzfunktionen. 


13.2. Konsistente Sehätzfunktionen 


Mit F(x,@) sei die Verteilungsfunktion des Merkmals X der Gesamtheit bezeich- 
net; der unbekannte Parameter Q ist zu schätzen. 

Wir betrachten eine Schätzfunktion U, des Parameters Q, wobei mit n der 
Stichprobenumfang bezeichnet ist. 

Offenbar ist oft der auf Grund einer Stichprobe geschätzte Wert des unbe- 
kannten Parameters vom wirklichen Wert dieses Parameters verschieden. Es ist 
jedoch natürlich zu verlangen, daß mit Anwachsen des Stichprobenumfangs 
die Wahrscheinlichkeit dafür, daß der geschätzte Wert nahe dem wirklichen 
Parameterwert liegt, gegen Eins strebt. 


Definition 13.2.1. Wir sagen, daß die Folge {U,} (nr =1,2,...) von Schätz- 
funktionen des Parameters Q konsistent ist, wenn sie für n — co stochastisch 
gegen Q konvergiert. 
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Ist U, Glied einer konsistenten Folge {U,} von Schätzfunktionen des Para- 
meters Q, so wollen wir kurz sagen, daß U, eine konsistente nn des 
Parameters Q ist. 

Gemäß der Definition der stochastischen Konvergenz (siehe 6.2) ist eine Schätz- 
funktion U,, konsistent, wenn für jedes & > 0 die Beziehung 


lim P(U,—-Q1>e)=0 (13.2.1) 
Nn>Xo 
besteht. 
Den geschätzten Wert des Parameters Q bezeichnen wir häufig mit Q*. 
Wir bringen einige Beispiele für konsistente Schätzfunktionen. 


Beispiel 13.2.1. Der Mittelwert einer Gesamtheit, deren Merkmal X normal N (m; 1) 
verteilt ist, sei unbekannt. Aus einer einfachen Stichprobe vom Umfang n bestimmen wir 
den Mittelwert x undnehmen m =& an. Mit anderen Worten, wir wählen als Schätzfunk- 
tion die Stichprobenfunktion 


n 


1 
= — X 
a 


wobei die Zufallsvariablen X, unabhängig sind und dieselbe Verteilung wie die Zufallsvariable 
X haben. Wie schon bekannt (siehe 9. 11), konvergiert X stochastisch gegen ın, d. h., X ist 
eine konsistente Schätzfunktion. 

Beispiel 13.2.2. Eine andere konsistente Schätzfunktion des unbekannten Mittelwerts m 
einer normalen Gesamtheit in einfachen Stichproben ist die Se das heißt 


der beobachtete Wert y der Positionsstichprobenfunktion {{P, wobei k = +1 ist. Die 


Mediane ist deshalb eine konsistente Schätzfunktion, weil für die N: ae der Zentral- 
wert mit dem Mittelwert zusammenfällt und weil nach Satz 10.4.1 die Stichprobenmediane 
stochastisch gegen die Gesamtheitsmediane konvergiert. 


Aus den obigen Beispielen ersehen wir, daß in einfachen Stichproben die 
Stichprobenmediane und der Mittelwert konsistente Schätzfunktionen des 
Parameters m sind. Nun kann man fragen, welche dieser beiden eine. bessere 
Schätzung für den Parameter m liefert, d.h. welche häufiger einen näher an m 
liegeiden Wert m* ergibt? Auch kann man fragen, welcher dieser Werte in dem 
Sinne besser ist, daß er Erwartungswerte E (m*) ergibt, die näher am wirklichen 
Wert von m liegen? Mit diesen Fragen wollen wir uns jetzt näher befassen. 


13.3. Erwartungstreue Schätzfunktionen 


Die Konsistenz einer Schätzfunktion drückt deren Grenzeigenschaften aus. 
Zur Charakterisierung einer Abschätzung kann sie nur benutzt werden, wenn 
große Stichproben vorliegen. Jetzt wollen wir den Begriff einer erwariungstreuen 
Schätzfunktionen angeben, der auch Schätzfunktionen in Stichproben eines be- 
liebigen Umfangs (klein oder groß) betrifft. 
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Ein geschätzter Wert, den man aus einer einzelnen Stichprobe gewonnen hat, 
kann vom wirklichen Parameterwert verschieden sein. Liegen jedoch Abschätzun- 
gen vor, die aus vielen Stichproben stammen, so ist es vernünftig, zu fordern, daß- 
der Erwartungswert dieser Abschätzungen gleich dem wirklichen Wert des un- 
bekannten Parameters ist. 


Definition 13.3.1. Es sei D eine Klasse von Verteilungsfunktionen F (x, @). Die 
Schätzfunktion U, des Parameters Q heißt erwariungstreu in der Klasse D, wenn 
für jede Verteilungsfunktion F (x, @) aus der Klasse D die Relation 


BU)=Q- w=el2,:) (13.3.1) 


besteht. Die Differenz Z(U,) — @ nennen wir die erwartungsmäßige Abweichung 
oder die Verzerrung der Schätzfunktion. Man nennt U, eine asymptotisch erwartungs- 
treue Schätzfunktion des Parameters Q in der Klasse D, wenn für jede Verteilungs- 
funktion F(x,Q) aus der Klasse D die Beziehung 


lim E(U,)=Q (13.3.1°) 


N 
erfüllt ist. 


Beispiel 13.3.1. Wir betrachten eine Gesamtheit, deren Merkmal X beliebig verteilt ist, 
und wollen den unbekannten Mittelwert E(X) = m abschätzen. 
Wir entnehmen dieser. Gesamtheit eine Stichprobe vom Umfang rn und bestimmen den 
Wert & der Stichprobenfunktion 
ET: RRe. 
X=— X, 
n x 
dabei haben die Variablen X, dieselbe Verteilung wie die Variable X. 
Die Stichprobenfunktion X ist eine erwartungstreue Schätzfunktion des Parameters m; 
wir haben nämlich 


a Se 1. 
EX, -E (= 3x.) = — SVEX,)=m. (13.3.2) 
n r-1 N - . 


Somit ist die Stichprobenfunktion X eine erwartungstreue Stichprobenfunktion des 
Erwartungswertes m in der Klasse D aller Verteilungsfunktionen von Zufallsvariablen, deren 
Momente erster Ordnung existieren. 


Die Stichprobenmomente einer Ordnung höher als 1 sind nicht immer erwar- 
tungstreue Schätzfunktionen der Gesamtheitsmomente, was wir an einem Bei- 
spiel zeigen wollen (siehe auch Aufgabe 9.12.17 bis 9.12.21). 


Beispiel 13.3.2. Der unbekannte Parameter einer beliebig verteilten Gesamtheit sei o?. 
Als Schätzfunktion dieses Parameters wählen wir die Stichprobenfunktion 


Bl. 
= DZ. (13.3.3) 
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Dabei sind die Zufallsvariablen X, unabhängig und haben dieselbe Verteilung wie die Zufalls- 
variable.X. Es gilt 


E(S?)=E (= za) - B(X) = B(X®) — E(XM. 
alien 
k=1 k=1 LilI#j) 7 
1 
= — BX)+” re ! mzyp 
Nr 


ist, erhalten wir also 


n—1i nr—1i n—i1 
E(S?) = ar EX?) — en [EXP = 02, (13.3.4) 


Daraus folgt, daß $? keine erwartungstreue Schätzfunktion des Parameters 0? ist. Wenn 


wir zum Beispiel für eine Reihe von einfachen Stichproben vom Umfang n = 2. den Wert 
i 0? 
s? als Abschätzung von o? wählen, so wird der Durchschnittswert dieser Abschätzungen = 


betragen. Jedoch ist 8? eine asymptotisch erwartungstreue Schätzfunktion des Parameters o2. 


Wie man leicht bemerkt, stellt die Stichprobenfunktion 


RL = (13.3.5) 


eine erwartungstreue Schätzfunktion des Parameters o? dar. Daraus kann man 
aber noch nicht schließen, daß für jeden einzelnen Versuch der Wert s? der Stich- 
probenfunktion 8? eine genauere Abschätzung des Parameters o? als der Wert s? 
liefert. Die Erwartungstreue ist eine Durchschnittseigenschaft. Wollen wir also in 
einer langen Reihe von Versuchen durchschnittlich gute Abschätzungen gewinnen, 
so müssen wir die Formel (13.3.5) anwenden. Dabei ist es jedoch nicht ausge- 
schlossen, daß die Abschätzung von ‚? mit Hilfe des Wertes s? im Einzelfall näher 
am wirklichen Wert von o? als s? liegu. Tis »esteht also kein Grund, einen der 
beiden besonders zu bevorzugen. 
Offenbar werden sich die Worte von 8? und 5] nur wenig voneinander unter- 
scheiden, wenn r groß ist. 
Wir bemerken, daß bei bekanntem Mittelwert m = E(X) die Schätzfunktion 


= rt: X — m)? (13.3.6) 


des Parameters o? erwartungstreu ist. In der Tat gilt 


E(S))=E (- > x) — m? = E(X?) — m? = 02. (13.3.7) 


N vi 
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Ist U eine erwartungstreue Schätzfunktion des Parameters Q, so folgt daraus 
noch nicht, daß jede Funktion f{ÜU) eine erwartungstreue Schätzfunktion des 
Parameters f(Q) ist. Wir zeigen dies an dem folgenden Beispiel. 


Beispiel 13.3.3. Das Merkmal X einer Gesamtheit sei normal N(m;c) verteilt, der 
Mittelwert m sei bekannt, während die Standardabweichung o unbekannt sei. Wie wir schon 
wissen, ist die Stichprobenfunktion 82 eine erwartungstreue Schätzfunktion des Parameters 
o?. Wir zeigen nun, daß die Schätzfunktion S, des Parameters o nicht erwartungstreu ist. 

“ Tatsächlich führen die Formeln (9.4.9) und (5.8.5) zu 


m oo n+i 
sa ns n=1 yar | 2 ) 
E(S)) = —. —— ee de — 
— n — {nn 
2,2 De — 
(202) (2); rr(z) | 
. Man erkennt leicht, daß die aus einer einfachen Stichprobe berechnete Stichprobenfunktion 
(1 
yar (5 ") 
2 
— {1 
y2rT (5 (n + y) 


eine erwartungstreue Schätzfunktion des Parameters o in der Klasse D der Verteilungsfunk- 
tionen normal verteilter Zufallsvariabler ist. 


(13.3.8) 


5 


B. Der Begriff der erwartungstreuen Schätzfunktion wurde durch GAUss einge- 
führt (siehe auch Davın und Neyman [1]). Einerseits braucht eine erwartungs- 
treue Schätzfunktion eines Parameters nicht immer zu existieren, andererseits 
kann es für ein und denselben Parameter viele erwartungstreue Schätzfunktionen 
geben. Dem Problem der Existenz und Eindeutigkeit von erwartungstreuen 
Schätzfunktionen sind unter anderen die Arbeiten von Haumos [1], LEHMANN und 
ScHErF& [1], KoLmocorRorr [14], Stein [2] und SCHMETTERER [2] gewidmet. 

Im weiteren wollen wir im Buch stets kurz von der erwartungstreuen Schältz- 
funktion sprechen, sofern nicht ausdrücklich die Notwendigkeit besteht, die 
Klasse D besonders zu kennzeichnen, in der die betreffende Schätzfunktion er- 
wartungstreu ist. 


13.4. _ Erschöpfende Schätzfunktionen 


_ Der Begriff einer erschöpfenden Schätzfunktion, der von FısHER [6] eingeführt 
wurde, erfordert tiefergehende Betrachtungen. 

In 12.4 definierten wir die Likelihood-Funktion L für stetige und für diskrete 
Zufallsvariable. Wir wollen jetzt eingehender stetige Variable betrachten. Es sei 
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f(x, @) die Dichte der Zufallsvariablen X, wobei Q ein unbekannter Parameter sei. 
X, (k=1,2,...,r) seien unabhängige Zufallsvariable, die ebenso wie X verteilt 
seien. Ferner seien 2,2% ...,% die beobachteten Werte der Zufallsvariablen . 
Xp Xg ..., X. Also stellt (&, &a -.-, %,) einen Punkt im n-dimensionalen Stich- 
probenraum dar. Diesen Punkt wollen wir mit A bezeichnen. 

Die Likelihood-Funktion L wurde durch die Formel 


L = fa, Q)f&2 Q)- Man, Q) 5 (13.4.1) 


definiert. Statt der Koordinaten x,, %,, ..., 2, des Punktes A im Stichprobenraum 
wollen wir die durch 


um (x Kay eer nm); (13.4.2) 


Y = Wil Ey...) %u) (G=1,2,..,r—1) 
definierten neuen Koordinaten 

U, Y» Ya 3 Ya-ı 
einführen. Dabei sei das System (uw, yı, Ya: --. Yn-ı). eine Sneindsuhige see 


Transformation des Systems (x, 23, ...,%,) mit überall stetigen partiellen Ak- 
leitungen 


2 IE ee 
IX 0% 
Die gemeinsame Dichte der neuen Zufallsvariablen (U, Y,,..., Y,-,) hat die 
Form 
a, dia. 0) am) 1J]|; (13.4.3) 


dabei sind die Zufallsvariablen x,, 2%, ...,%, Funktionen der Zufallsvariablen 
u, Yyp Ya ++, Yu, und J ist die Funktionaldeterminante der zu (13.4.2) inversen . 
Transformation. Wir bezeichnen mit g(u,Q) die Dichte der Zufallsvariablen U. 

Wir betrachten die bedingte Verteilung der Zufallsvariablen (Y,, Ya ..., Ya-ı) 
unter der Bedingung, daß U einen gegebenen Wert u annimmt. Die Dichte dieser 
Verteilung wollen wir mit 


h(yı, Ym oo: Yn-1|%, Q) (13.4.4) 


bezeichnen. Aus (13.4.3) folgt unter Berücksichtigung einer zu (2.7.6) analogen 
Formel die Gleichung 


Kay, fa Fan 11 = 9m Oh lyı Ya ++, Ya-1l%Q). (13.4.5) 
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Wir wählen die durch (13.4.2) bestimmte Stichprobenfunktion U als Schätz- 
funktion für den Parameter Q. Wenn in einem gewissen Intervall der Werte von Q 
die partiellen Ableitungen 


öf og oh 
°Q’ °Q’ 80: 
existieren und die Ungleichungen 
Ei 
1%0 


erfüllen, wobei die Integrale 


oh 


g < G,(%), Fr | < H,Wı: Ya +++» Yn-ı: u) 


ö 
< Fo), n 


eQ 


[Fow@) dx, [eotu) au, [uotu) au 


und 
IE: [Hswı Yas +++» Yn-ı U) dyıdYa-ı 


endlich sind, nennen wir Ü eine reguläre Schätzfunktion des Parameters @. Im 
folgenden wollen wir uns auf reguläre Schätzfunktionen beschränken. 


Jetzt können wir auch den Begriff einer erschöpfenden Schätzfunktion defi- 
nieren. 


Definition 13.4.1. Es sei D die Klasse der Verteilungsfunktionen F(x,®). 
Eine Stichprobenfunktion U ist eine erschöpfende Schätzfunktion des Parameters Q 
in der Klasse D, wenn für jede Verteilungsfunktion F(x,@) aus der Klasse D die 
Dichte (13.4.4) der gemeinsamen bedingten Verteilung der Zufallsvariablen 
(Yı Y 3 -.., Ya-ı) unter der Bedingung U=w für g(wQ)>0 von Q unab- 
hängig ist. 

Im weiteren werden wir kurz von einer erschöpfenden Schätzfunktion sprechen, 
während wir die Klasse D, in der die Schätzfunktion erschöpfend ist, nur dann be- 
sonders kennzeichnen werden, wenn sich das nicht von selbst aus dem Text er- 
gibt. 

Daher hat die Likelihood-Funktion Z, wenn die Schätzfunktion U erschöpfend 
ist, die Form 


L= gu, Q)h(yı Ya ---» Yu-ı|%). (13.4.6) 


Wenn Ü eine erschöpfende Schätzfunktion ist, so ist für einen festen Wert u die 
bedingte Verteilung in Punkten Z auf der Hyperfläche mit der Gleichung U =u 
konzentriert. Da die bedingte Wahrscheinlichkeit auf dieser Hyperfläche von @ 
unabhängig ist, liefert die Präzisierung der Lage des Punktes E auf dieser Hyper- 
fläche keine neuen Informationen über den Parameter Q. Mit anderen Worten: 
Ist U eine erschöpfende Stichprobenfunktion, so ist die bedingte Wahrschein- 
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lichkeit irgendeiner anderen Stichprobenfunktion U, unter der Bedingung 
U =u von Q unabhängig; demzufolge ergeben sich daraus ebenfalls keine neuen 
Informationen über ®. 

Wir bemerken, daß die hier nachgewiesene Eigenschaft einer erschöpfenden 
Stichprobenfunktion FISHER zur Definition dieses Begriffes gedient hat und daß 
sie auch die Bezeichnung erschöpfende Stichprobenfunktion erklärt. Die hier gege- 
bene Definition 13.4.1 ist, wie NEYMAN [3] und Darmoıs [1] gezeigt haben, der 
Fisherschen Definition gleichwertig. 

Falls eine Stichprobenfunktion erschöpfend ist, hängt, wie aus (13.4.6) hervor- 
geht, die Maximum-Likelihood-Abschätzung des Parameters Q nur von dem 
Wert der Variablen U ab, während er von den speziellen Werten der Variablen 
XpX2 ..., X,, deren Funktion U ist, unabhängig ist. 


Beispiel 13.4.1. Das Merkmal X einer Gesamtheit sei normal N (m; co) verteilt, wobei 
der Mittelwert m unbekannt sei. Als Schätzfunktion U des Parameters wählen wir 


I ;@ er 
U= — YX,=X. 
N 


” 
il 
» 


. Dabei mögen die Variablen X, voneinander unabhängig sein und dieselbe Verteilung N (m; o) 
haben. Die Schätzfunktion U ist in jedem Intervall a < m << b regulär. Aus Formel (9.5.10) 


folgt 
Zi ns? 
Yn _n @-m): n 2? exp (- ie) gr—2 
L = fie, m) a, m) fan m)=2——e ? 
co y2r et r—1i 
(20?) 2 r( 
2 
(13.4.7) 


Wie man sieht, kann man die Likelihood-Funktion L als Produkt darstellen; dabei ist der 
zweite Faktor auf der rechten Seite die Dichte der Zufallsvariablen 8 (siehe 9.5). Dieser 
Faktor ist vom Parameter m unabhängig. Die Schätzfunktion U ist also erschöpfend. 


Die hier für stetige Zufallsvariable eingeführten Begriffe lassen sich ohne 
Schwierigkeiten auf diskrete Zufallsvariable übertragen. 

Der Begriff der erschöpfenden Schätzfunktion läßt sich für den Fall verall- 
gemeinern, daß mehrere Parameter unbekannt sind (siehe CRAMER [2], SCHMETTE- 
RER [1], BARANKIN und Kurz [1] sowie die Aufgaben 13.10.11 bis 13.10.14). Tiefer- 
gehende und allgemeinere Grundlagen der Theorie der erschöpfenden Schätz- 
funktionen findet man in der Arbeit von HaLmos und Savage [1]. 


13.5. Wirksamste Schätzfunktionen 


A. Eine wichtige Eigenschaft einer Schätzfunktion, die anschaulicher als die ist, 
erschöpfend zu sein, stellt die Wirksamkeit dar, die ebenfalls von FısHer [2], [6] 
eingeführt wurde. 


544 13. Theorie der Schätzfunktionen 


Eine erwartungstreue Schätzfunktion ist eine Zufallsvariable, deren Erwar- 
tungswert gleich dem unbekannten Parameter ist. Nun ist es einleuchtend, daß 
die möglichen Werte einer Schätzfunktion sich desto näher um ihren Erwartungs- 
wert häufen, je kleiner die Dispersion dieser Schätzfunktion ist. Um so größer ist 
dann die Wahrscheinlichkeit dafür, daß die Abschätzung des unbekannten Para- 
meters nahe dem wirklichen Parameterwert liegt. Es ist also angebracht zu fordern, 
daß die Dispersion der Schätzfunktion möglichst klein sei. Diese Eigenschaft 
kommt den wirksamsten Schätzfunktionen zu. 

Zuerst befassen wir uns mit der Herleitung einer wichtigen Ungleichung, die 
nach RAo-CrAam&r (Rıo [1], CRAMER [2]) benannt ist. Wir wollen sie gesondert 
für stetige und für diskrete Zufallsvariable formulieren. 

Die Ungleichung von RAo-CRAMER. Es sei U eine reguläre erwartungstreue 
Schätzfunktion des Parameters Q in einfachen Stichproben vom Umfang n. 

Ist das Merkmal X stetig mit der Dichte f(x,@) verteilt, so gilt 


D°(D) = BL — 012 - 


(13.5.1) 


x 


oo 


Ist das Merkmal X diskret mit den Sprungstellen x,, %s, ... und der Wahrschein- 
lichkeitsfunktion P(X = x;) = p,(Q) verteilt, so gelt 


1 


dlog p(Q* 
nd (2) 9:(Q) 


Beweis. Wir beschränken uns auf den Beweis der Formel (13.5.1). Aus unseren 
Voraussetzungen über die Regularität (siehe 13.4) der Schätzfunktion U folgt, 
daß man die Identität 


D:(U) = E[(U — Q > (13.5.1’) 


teQar =) - Mur ulm dd 


unter dem Integralzeichen nach @ differenzieren kann. Wir erhalten 


x 


f: nee) ix, Q) dx (13.5.2) 


-o 


x 


u je f oo >Q a k(Yis +++» Yn-1 1% Q) dyı dya-ı =0. 


=-o u) 
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Wenn wir die logarithmische Ableitung auf beiden Seiten der Gleichung (13.4.5) 
bilden [dabei betrachten wir ihre linke Seite als Funktion der Zufallsvariablen 
&(k=1,2,...,n)], so erhalten wir 


„este 0) _ dlog g(w,Q) | ‚ 2loghlyn 4m 9) 


13.5. 
= °Q oQ 29 N 


Wir quadrieren beide Seiten der Gleichung (13.5.3) und multiplizieren sie mit der 
Gleichung (13.4.5). Es ergibt sich 


n [dlog f(x, Q) 0 log f(xı, 9) log f(x, 0) 
| °Q [+2° Q 00 


I#j 


=” 


k=1 


eu a9) 


ol 2 ölog hl? ol öloge h 
| u +| | a 10th el. 


°Q 00 80 9 
(13.5.4) 
Es gilt nun 
f [2 ee? %p, ai 9), 9) day dan 
_„ [ [eis ie, of | 
u =) °Q I (13.5.5) 


co 


Die linke Seite der Gleichung (13.5.2) ergibt 


f zes le on Does. 


°Q 
- 0 I#j 
(13.5.6) 
während aus der rechten Seite von (13.5.2) 
log g(u, 
ii MORE ER 

Q 

ölo h, 
x 2 ie: - KYyı +++, Yn-11%, Q) dyıdyn-, = 0 (13.5.7) 


35 Fisz 
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folgt. Wenn wir beide Seiten der Gleichung (13.5.4) integrieren und die Formeln 
(13.5.5) bis (13.5.7) beachten, erhalten wir 


f dlog f(x, Q)]? u ° ö log g (u, Q)]? 
[resfinoe- eestfio 


oo oo oo 


log h 
+ [vw ) Be: &% — jr (Yu +++ Yn-1l% Q) dyır- un 
= | ee woran. . (13.5.8) 


Nach Voraussetzung ist die Stichprobenfunktion U eine erwartungstreue Schätz- 
funktion für den Parameter @; also ist 


— Suot, V)du=R. (13.5.9) 


Außerdem folgt aus der vorausgesetzten Regularität die Differenzierbarkeit der 
Gleichung (13.5.9) in bezug auf Q unter dem Integralzeichen. Wir erhalten somit 


oo 


1 [ui Es Er u 
a ee) ET) 9) du,  (13.5.10) 


also 


I 


[ara gerne 2. ud 


oo 
!) Diese Umformung ergibt sich daraus, daß J 9wQ)du = 1 ist und daß man dieses 
—00 
Integral unter dem Integralzeichen differenzieren kann, woraus 
oo 
5 DV mo 
80 


0 
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Nach der Schwarzschen Ungleichung (siehe etwa FICHTENHoLz [1]) erhalten: wir 
die Ungleichung 


1< f (u — Oyglu, Q)du ee O)du. (13.5.1) 
Wir schreiben (13.5.11) in der Form ° 
D2(D) = | (u Om, Q)du> — - 
Femme 


Unter Berücksichtigung von (13.5.8) erhalten wir 


i 


D:(D) > 


oo 


2 log fix, Q)P? 
| e0ar 


x 


Die Ungleichung (13.5.1) ist damit bewiesen. 

Nach dieser Ungleichung ist die Dispersion der Schätzfunktion U eines Para- 
meters Q) nicht kleiner als eine gewisse feste Größe, die durch n und die Verteilung 
der Gesamtheit bestimmt wird. 


B. Wir wollen nun den Begriff der wirksamsten Schätzfunktionen definieren. 


Definition 13.5.1. Eine erwartungstreue Schätzfunktion U des ParameteısQ 
heißt wirksamste Schätzfunktion für die Klasse D von Verteilungsfunktionen,wenn 
für jede Verteilungsfunktion F(x,Q) aus der Klasse D die Varianz D2(U) den 
durch die Formeln (13.5.1) bzw. (13.5.1’) gegebenen minimalen Wert erreicht. 

Im weiteren werden wir häufig kurz wirksamste Schälzfunktion sagen. 

Aus dieser Definition folgt, daß, allgemein ausgedrückt, die Werte einer er- 
wartungstreuen wirksamsten Schätzfunktion so dicht wie nur möglich um den 
Wert E(U) =Q gehäuft liegen; die Wahrscheinlichkeit, daß der beobachtete 
Wert % dieser Schätzfunktion nahe am wirklichen Wert des unbekannten Para- 
meters (Q liegt, ist also so groß wie nur möglich. 


Satz 13.5.1. Eine erwartungstreue Schätzfunktion U des Parameters Q ist genau 
dann eine wirksamste Schätzfunktion, wenn 


a) die Schätzfunktion erschöpfend ist, 


35* 
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b) ihre Dichte g(w,Q) für gta, Q)>0 fast überall!) die Gleichung 


dlog g(u, ©) 
-2Q 


erfüllt, wobei die Zahl ce von u unabhängig ist (sie kann aber von Q abhängen). 


=c(u—0Q) (13.5.12) 


Beweis. Wir wollen zuerst zeigen, daß diese Bedingungen hinreichend sind. 
Es seien also die Bedingungen a) und b) erfüllt. Nach a) ist die bedingte Dichte h 
[siehe (13.4.4)] von @ unabhängig. (13.5.8) nimmt also, falls wir die Bedingung b) 
berücksichtigen, die Form 


n I Fe re Q)de=e N (u — Q2g(u, Q) du = &:D2(U) 
an, während (13.5.10) die Gestalt 
1=e | (u Qrglu@)du = cD2(U) 


bekommt. Eliminieren wir aus diesen beiden Gleichungen c, so erhalten wir 


D:(U) = ! (13.5.13) 


n jr ii f&,@dz 


Nun wollen wir die Notwendigkeit der Bedingungen a) und b) nachweisen. 
Wir nehmen also an, die Gleiehung (13.5.13) sei erfüllt. Aus (13.5.8) folgt dann, 
daß die bedingte Dichte A von Q unabhängig ist, da anderenfalls wegen (13.5.11) 
die Ungleichung 


D2(0) > i 


x 


2 log fix, Q)]? l 
ll [104 


gelten würde, was (13.5.13) widerspricht. Damit ist gezeigt, daß die Schätzfunk- 
tion U erschöpfend ist, daß also die Bedingung a) erfüllt ist. 
. Wir schreiben jetzt (13.5.8) in der Gestalt 


oo 


i dlog g(u, Q)]? 
[anne 


1) Das heißt mit Ausnahme einer Menge, deren Lebesguesches Maß gleich Null ist. 
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Dieser Ausdruck ist identisch mit der Formel (13.5.11), in der das Zeichen- < 
durch das Gleichheitszeichen. ersetzt wurde. Wie man weiß, ist dafür, daß in 
der Schwarzschen Ungleichung das Gleichheitszeichen gilt, die Existenz zweier 
nicht gleichzeitig verschwindender Konstanten w und v notwendig, derart, daß 
die Gleichung 


Fr DE ERNERIIERENN —_—_ 12 
[ le (low) +v an Yo, ö) du=0 (13.5.14) 


gilt. Der Ausdruck unter dem Integralzeichen ist nicht negativ. Die Gleichung 
(13.5.14) gilt also nur dann, wenn fast überall 


w- (u Q)Vow O) +v um Yo, 9) =0 (13.5.18) 


ist. Da der Ausdruck (u — Q) Yo (u, @) nicht fast überall verschwinden kann 
(die Dispersion der Schätzfunktion U wäre dann gleich 0), gilt also für g(, @) > 0 
die Gleichung (13.5.15) nur dann, wenn die Gleichheit (13.5.12) gilt. Die Be- 
dingung b) ist also ebenfalls erfüllt. 

C. Es sei U eine erwartungstreue wirksamste Schätzfunktion des Parameters Q, 


und U, sei eine andere erwartungstreue Schätzfunktion dieses Parameters. Als 
Maß für die Wirksamkeit der Schätzfunktion U, kann der Ausdruck 


_ _D2(0) 
 D(D,) 


e (13.5.16) 


dienen. Für erwartungstreue wirksamste Schätzfunktionen ist e =1. 

Falls die Dispersionen der verglichenen Schätzfunktionen umgekehrt pro- 
portional zu » sind, können wir den Wert e folgendermaßen.interpretieren. 
Durch eine wirksamste Schätzfunktion U erhalten wir aus einer Stichprobe 
vom Umfang n eine Abschätzung des unbekannten Parameters Q von derselben 
Güte (vom Standpunkt der Wirksamkeit betrachtet) wie mit Hilfe der Schätz- 


funktion U, aus einer Elemente zählenden Stichprobe. 
e 


Praktisch ist es angebracht, wirksamste Schätzfunktionen zu verwenden, da 
sie am ökonomischsten sind; sie existieren aber selten. 


Beispiel 13.5.1. Wir zeigten im Beispiel 13.4.1, daß die einfache Stichprobenfunktion 
U=X eine erschöpfende Schätzfunktion für den Parameter m einer Normalverteilung 
N (m; o) ist, falls die Standardabweichung bekannt ist. Wir zeigen jetzt, daß diese Schätz- 


funktion auch eine wirksamste ist. 
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Es genügt zu beweisen, daß die Bedingung (13.5.12) erfüllt ist. Tatsächlich ergibt die 
Formel (13.4.7) 


yz,m) =. n exp (- ” =) (13.5.17) 


FBE 2 
co V2r Os, 
woraus 


ol z, % 
ee (13.5.18) 
om o? 


folgt. Somit ist der Stichprobenmitteiwert, wenn die Stichprobe einfach ist und aus einer 
normalen Gesamtheit stammt, eine wirksamste Schätzfunktion des unbekannten Gesamtheits- 
mittelwerts. 

Wie man aus (13.5.17) ersieht, gilt 


1% 


D:(X) = (13.5.1) 


Dies ist die minimale Dispersion einer regulären und erwartungstreuen 'Schätzfunktion 
für den Parameter m einer normalen Gesamtheit in einfachen Stichproben vom Umfang n. 


Beispiel 13.5.2. Das Merkmal X einer Gesamtheit sei normal verteilt mit der Dichte 


_(@=m)? 


em, -(13.5.20) 


I, eo?) cz 


Dabei sei m bekannt und o unbekannt. 


Mit Hilfe einer einfachen Stichprobe vom Umfang n wollen wir o?2 abschätzen, indem 
wir als Abschätzung den beobachteten Wert s? der Schätzfunktion 


=, Sl (X, — m)? (13.5.21) 


wählen. Diese Schätzfunktion ist in einem beliebigen Intervall a < 0?2< b (a> 0) regulär. 
Wie bekannt ist (siehe 13.3), ist 82 eine erwartungstreue Schätzfunktion für die Dispersion 
o®?. Wir zeigen, daß sie für die Klasse der Verteilungsfunktionen von Zufallsvariablen mit 
Normalverteilung auch eine wirksamste ist. 


So folgt aus Formel (9.4.9) 


3% 2 

98,0) = - _ (13.5.22) 

— 2 

202)2 TI— 

(20% (=) 

und daraus 
ol s2, 0? 

te ram, (13.5.23) 


do? 20% 


- 
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Die Bedingung (13.5.12) ist also erfüllt. Andererseits haben wir 


PX:Z  m)* 
k=1 


L= f(&, 0°) f(x, 0°) *-- (an, 02) = — &p]|- 5 
a 20 
oR (2)? 
n 
Tr!I_ 
1 n.8 2 2 (; ) = 
= = exp | — I = 9 (s,, 0°) Ga (13.5.24) 
or (2) 2 a2 n? si=? 
Wie wir sehen, ist der zweite Faktor auf der rechten Seite der Formel (13.5.24) von 0? un- 


abhängig. 
Die Bedingungen a) und b) sind also erfüllt, und 8% ist eine wirksamste Schätzfunktion 
für den Parameter 0°, 


Die minimale Dispersion für reguläre und erwartungstreue Schätzfunktionen 
des Parameters o? finden wir aus den Formeln (13.5.13) und (13.5.20): 


DS) = — = 
N rl 0?) dx 
GO 
ai eu zZ l un Bi (13.5.25) 
BR 11 ” 
NR f = = =] fix, 0?) dx 


Beispiel 13.5.3. Das Merkmal X einer Gesamtheit sei normal N (m;o) verteilt. Wir 
wählen als Abschätzung der Dispersion 0? den beobachteten Wert u der Schätzfunktion 


n 
(X, — X)% 
U ge — #=1 


n—1 n—1 


(13.5.26) 


in einer einfachen Stichprobe vom Umfang n. 

Diese Schätzfunktion U ist erwartungstreu (siehe 13.3) und in einem beliebigen Intervall 
a<02<b (a> 0) regulär. Die Schätzfunktion: ist jedoch nicht erschöpfend, folglich erst 
recht keine wirksamste. Dies folgt auch unmittelbar aus (13.4.7), da die Standardabweichung o 
doch in beiden Faktoren auf der rechten Seite dieser Formel vorkommt. Leicht sieht man, daß 


n 20% 
D? 82) — 
n—i n—i 


ist. Die Wirksamkeit dieser Schätzfunktion beträgt nach Formel (13.5.16) 
D:2(82) n—1 


mi 9 * 
n—1 
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Beispiel 13.5.4. Wir setzen dieselben Bedingungen wie im Beispiel 13.5.3 voraus und 
wollen die Standardabweichung o mit Hilfe der Schätzfunktion 


— ” 
= 5, (13.5.27) 


— n-+1 
23T 
vr) 
abschätzen. 


Wie schon bekannt [siehe Beispiel 13.3.3, Formel (13.3.8)], ist U eine erwartungstreue 
Schätzfunktion des Parameters o. Mit einer ähnlichen Überlegung wie bei der Stichproben- 
funktion 5 können wir erkennen, daß U eine erschöpfende Schätzfunktion für den Parameter 
c ist. Jedoch ist U für diesen Parameter keine wirksamste Schätzfunktion. Wir haben nämlich 


U 


Ki K?u? 
g(u,c) = — tt urlexp I- a | (13.5.28) 
or 0? 
mit 
1 
den 
K,= 


Daraus erhalten wir 


ölog g(w, 0) ” 2K, (r =). 


öo 0° = 2K, 


Die Bedingung (13.5.12) ist also nicht erfüllt. 
Den minimalen: Dispersionswert einer regulären und erwartungstreuen Schätzfunktion 
für den Parameter o finden wir aus Formel (13.5.1). Er beträgt 


1 0? 
en (13.5.29) 


© Sankt 2 
om" 1 1: Er = 
n es — 2° de 
o | oy2r 


oo 


Man kann zeigen, daß die Dispersion der Schätzfunktion U, die durch die Formel (13.5.27) 
0? 
definiert wurde, wie auch zu erwarten war, größer als zp ist. 
. n 


Beispiel 13.5.5. Das Merkmal X einer Gesamtheit sei normal N (m; co) verteilt. Dabei 
sei m bekannt, während o ein unbekannter Parameter sei. Als Abschätzung dieses Parameters 
wählen wir in einer Stichprobe vom Umfang n die mit 0,5” multiplizierte mittlere 
Abweichung, d.h. den beobachteten Wert « der durch 


1 r n 
U = — Y0,5n 1X, —m| (13.5.30) 
N I=1 , 
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. 


definierten Schätzfunktion U. Die Variablen X, seien dabei unabhängig und mögen dieselbe 

Verteilung haben wie die Variable X. Wir untersuchen die Wirksamkeit dieser Schätz- 

funktion U. Zuerst wollen wir nachprüfen, ob U für den Parameter o erwartungstreu ist. 
Wir haben 


x 


; am 
E(X — m|) = —— fr —mje = de 


o y2r 


00 
oo 
(2m)? "Dr 
2 - 2 
= @-me %* tem a 2 
oV2r yr 
y m 
also 
17/n & n 
EU) = ne N E(X,— m|) >, Mae =o. (13.5.31) 
N 2 k=1 2 
Ähnlich erhalten wir 
rn —2 
D:(U) = 02. (13.5.32) 


Diese Schätzfunktion U ist aber keine wirksamste. Ihre Wirksamkeit e beträgt nämlich 


0 n—2 1. 
ie 2 = 0,876. 13.5.33 
In m 2 ( ) 


D. Wir wollen jetzt wirksamste Schätzfunktionen in Stichproben aus Gesamt- 
heiten betrachten, in welchen das untersuchte Merkmal eine diskrete Zufalls- 
variable ist. 


Beispiel 13.5.6. Das Merkmal X einer Gesamtheit sei binomial verteilt, d.h., es gelte 


mr =n-(,)men. =1-—-p, 0<p<i (k = 0,1,...,r). 
‚(13.5.34) 


Dabei sei p der unbekannte Parameter, den wir auf Grund einer aus dieser Gesamtheit er- 
hobenen.einfachen Stichprobe vom Umfang n abschätzen wollen. 

Wir berechnen nach (13.5.1”) die minimale Dispersion für eine reguläre und erwartungs- 
treue Schätzfunktion U des Parameters p: 


1. r ee) 7 | kr-— ) 
DD) Z( Fr raue 
" (k — pr\2 n n nr 
=. ee Re © Barren (13.5.35) 
vo\ 29 Far 2°q 29 
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Als Abschätzung für den Parameter p wählen wir den beobachteten Wert der Schätzfunktion 
n 
=— VX, (13.5.36) 


wobei die Zufallsvariablen X, unabhängig seien und dieselbe durch Formel (13.5.34) be- 
stimmte Verteilung haben. 
Wir haben 


npgr 29 
EU)=—=p MüÜ)=-——. =. 
nr r°% nr 


(13.5.37) 


Daraus folgt. daß die Stichprobenfunktion U eine erwartungstreue und wirksamste Schätz- 
funktion ist. 

Wir betrachten den Spezialfall r=1, d.h., die Variable X habe eine Null-Eins-Ver- _ 
teilung mit PX =1)=p, PX =0)=g. Als Abschätzung des unbekannten Parameters 
wählen wir den Wert w=p*=X der Stichprobenfunktion aus der Formel (13.5.36). Dies 
ist der beobachtete Wert der wirksamsten Schätzfunktion für den Parameter p. 

In einer Gesamtheit mögen sich fehlerlose und fehlerhafte Exemplare befinden, der Anteil 
» der fehlerhaften Stücke sei unbekannt. Dem Auftreten eines fehlerhaften Stückes ordnen 
wir die Zahl 1, dem eines fehlerlosen die Zahl.0 zu. Wenn sich in einer Stichprobe vom Umfang 
n nun %, fehlerhafte Stücke und n — n, fehlerlose Stücke befinden, so wählen wir als Ab- 
schätzung des Parameters p die Zahl 


nn i+n— n)0 nn 
n mn’ 
das ist der Anteil der fehlerhaften Stücke in der Stichprobe. Somit kommen wir zu dem 
Schluß, daß die Häufigkeit einer bestimmten Kategorie von Elementen in einfachen Stich- 
proben eine wirksamste Schätzfunktion für die Häufigkeit dieser Kategorie in der Gesamtheit 
ist, 
Beispiel 13.5.7. Das Merkmal X einer Gesamtheit habe die Poissonsche Verteilung 


vi; 
m=P(X=h)= 0" (k = 0,1,2,...), (13.5.38) 


wobei der Parameter A unbekannt sei. 

Die minimale Dispersion für eine reguläre und erwartungstreue Schätzfunktion U des 
Parameters A in einfachen Stichproben vom Umfang n, die aus dieser Gesamtheit stammen, 
berechnen wir nach der Formel (13.5.1): 


1 © /d log p,\? & [k \2 n. & 

u = in Vezi 

»(v) >| Fr Mn Pa 7 Pr ” = ( A)’Pr 
> 2 | (13.5.39 
=,=7 .3.39) 


Als Abschätzung für den Parameter A wählen wir den beobachteten Wert 


vwelt-r. 
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Man stellt leicht fest, daß dies der beobachtete Wert einer erwartungstreuen und wirksamsten 
Schätzfunktion ist. Es gilt also 


A 
E(U) =4, D:(U) = z (13.5.40) 


E. Wir wollen zum Abschluß über neue Ergebnisse bezüglich der Wirksamkeit 
der erwartungstreuen Schätzfunktionen sowie über den Satz von BLACKWELL 
informieren. 

Es sei D die betrachtete Klasse der Verteilungsfunktionen F(x,Q). Wir be- 
trachten sämtliche erwartungstreuen Schätzfunktionen des Parameters Q in der 
Klasse D, die für jede Verteilungsfunktion F(x,Q) aus D eine endliche Varianz 
haben. Dann ist, wie LeHMmAnn und SCHEFF# [1] gezeigt haben, höchstens eine 
dieser Schätzfunktionen in der betrachteten Klasse D am wirksamsten. Gewisse 
Verallgemeinerungen dieses Ergebnisses hat SCHMETTERER [2] angegeben. Das 
von LEHMANN und SCHEFFE behandelte Problem wurde in der Arbeit von STEIN 
[3] unter einem anderen Gesichtspunkt untersucht. 

BLACKWELL [2] hat gezeigt, daß bei Vorliegen einer erwartungstreuen Schätz- 
funktion V des Parameters Q sowie einer weiteren erschöpfenden Schätzfunktion 
U desselben Parameters sich eine weitere erwartungstreue Schätzfunktion des 
Parameters & konstruieren läßt, die wenigstens ebenso wirksam ist wie V. Dies 
geht aus dem folgenden Satz von BLACKWELL hervor: 


Satz 13.5.2. Es sei V eine erwartungsireue Schätzfunktion des Parameters Q 
und U eine erschöpfende Schätzfunktion des Parameters Q. Dann ist die Zufalls- 
variable E(V|u) (siehe 3.6.0) ebenfalls eine erwartungstreue Schatzfunktion ‚des 
Parameters Q. Existiert darüber hinaus die Varianz D®(V), so gilt die Ungleichung 


D’[E(V |wW] = D%(P). .(13.5.41) 


Das Gleichheitszeichen in (13.5.41) steht nur dann, wenn die Beziehung E(V |u) = 
mit der Wahrscheinlichkeit 1 erfüllt ist. 


Beweis. Aus der Voraussetzung, daß die Schätzfunktion U erschöpfend ist, 
folgt, daß E(V |u) nicht von Q abhängt. Da die Schätzfunktion V RUE 
ist, erhalten wir unter Anwendung der Formel (3.6.24') 


EN=EEVW=-®; 


daher ist Z(V |u) eine erwartungstreue Schätzfunktion des Parameters Q. 

Wir geben nun den Beweis der Formel (13.5.41) für den Fall, daß alle im Satz 
auftretenden Zufallsvariablen vom stetigen Typ sind (vgl. 2.7.B). 

Es seien f(v, u) bzw. g(w) die Dichtefunktionen der Zufallsvariablen (Y, U) und 
U, und es möge h(v|u) die bedingte Dichte der Variablen Y unter der Annahme 


£ 
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U=u sein. Wegen (3.6.23') haben wir 


D:(V) = E(V?) — Q? (13.5.42) 


= [om Frrwiw dvdu — [ow| IX) a0| au 


+ [rw| Forwiw | -| Fo [ortin dv al 


wobei A die Summe aus dem ersten und zweiten Integral auf der rechten Seite 
von (13.5.42) und B die Summe der beiden anderen Integrale ist. 
‚Wir können also schreiben 


A= [rw! [row -| forww) fl. du, (13.5.43) 


= [ee] oo 


zumal sich B in der Form 
B = E{[E(V |w} — {BIE(V |W]% = DELE(V |w)] (13.5.44) 


schreiben läßt. Der Ausdruck in der eckigen Klammer auf der rechten Seite von 
(13.5.43) ist die bedingte Varianz der Zufallsvariablen V unter der Annahme 
U=u; A ist somit nichtnegativ. Aus den Beziehungen (13.5. ai bis > 5.44) 
folgt aber 


Dem =A+B2B=D{E(VW); 


die Beziehung (13.5.41) ist somit erfüllt. 

Das Gleichheitszeichen in (13.5.41) gilt, wenn A =(0), d: h. (vgl. 5.1), wenn die 
bedingte Verteilung der Zufallsvariablen V unter der Voraussetzung U=u 
mit der Wahrscheinlichkeit 1 singulär ist. Mit anderen Worten, die Zutallsvariable 
V nimmt für jeden gegebenen Wert u einen (zufälligen) Wert mit der Wahrschein- 
lichkeit 1 an. Es gilt daher Z(Y |u) = V mit der Wahrscheinlichkeit 1. 

BARANKIN [1] erweiterte den Satz von BLACKweLL auf beliebige zentrale 
Momente ‘der Schätzfunktionen eines unbekannten Parameters. 


F. Der Begriff der wirksamsten Schätzfunktion läßt sich (CRAMER [2]) für den 
Fall der Abschätzung mehrerer unbekannter Parameter erweitern. Es muß dann 
der Begriff der gemeinsamen wirksamsten Schätzfunktion eingeführt werden, wozu 
eine Verallgemeinerung der Ungleichung von RAo-CRAM£r benötigt wird. Diese 


16.6. Schärfe und Konsistenz nichtparametrischer Tests j j 661 


Wert des Integrals nicht kleiner. Wir haben daher 


üo Un 1 ı 
L-M<salle| fe [da -dz; d2,_... da. (16.6.13) 
; i 


23 241 Zn-i 


Nach Berechnung des Integrals auf der rechten Seite von (16.6.13) erhalten wir 


, n k--1 n—-k+1 x n i ni 
M=z% kA ww (ı1— u)" = N .J)wıl — u) 


i=0 \% 


Damit ist die Ungleichung (16.6.8) bewiesen. 

Birnsaun [3] hat auch die obere Grenze der Güte dieses Tests angegeben. 
Mit dem Problem der Güte des Tests D; im Vergleich zur Güte einiger anderer 
nichtparametrischer Tests beschäftigte sich CHarman [3]. In der gleichen Arbeit 
empfiehlt CHapman einige neue Gütekriterien für nichtparametrische Tests. 


D. Aus der Beziehung (16.6.8) erhält man leicht einen asymptotischen Ausdruck 
für die untere Grenze des betrachteten Tests bei großen n, wobei sich herausstellt, 
daß sich diese untere Grenze dann mit Hilfe der Normalverteilung darstellen läßt. 
Wir wollen jedoch zu dem gleichen Ergebnis nach einem anderen, von Massey [1] 
angegebenen Verfahren gelangen. Wir bestimmen hierbei die untere Grenze des 
auf der Stichprobenfunktion D,—= sup |F,(&) — 8,(%)| beruhenden Tests, 


-wo<r<oo 
das gleiche Verfahren läßt sich auf den auf der Stichprobenfunktion D,; beruhen- 
den Test anwenden. 

Wiederum sei die stetige Verteilungsfunktion F(x) unbekannt. Die Null- 
hypothese sei A,[F (x) = F,(&)], die Alternativhypothese sei Z,[F(x) = @(«)], 
wobei F,(x) gegeben ist, @(x) der Beziehung 

sup |F,&@) —- G@)!=65>0 - - (16.6.14) 


w<r<o 


genügt und der Wert von @ (x) an der Stelle x, gegeben ist, für die die Gleichung 


| Foo) — Elzo)| = 6 (16.6.15) 


gilt. Wir setzen den Kolmogoroffschen 4-Test an und lehnen die Hypothese A, 


zugunsten ihrer Alternativhypothese ab, wenn der Wert d, =, Yn. beobach- 
tet wird; dabei genügt A, der Beziehung. 


P(YnD, >) =e. (16.6.16) 
Den Wert von A, bestimmen wir aus der Tafel VIII. Die Testgüte M ist durch 
P(YnD, 2 116) | 
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gegeben. Wir haben 


M = P(Yn|S1(o) — Folo)| 2 4,!6(@)) 


1 (rn — A < SR) <Folzo) + | au) 


Yn = 


Sodann setzen wir 


Fol) = Cl) + 6 


und erhalten nach einfachen Umformungen 


si r( —AtöVn _ _ Bol) — Ela] Yr 
Ye@)ll - Ca) Ye@)ll — Eko] 


en) (16.6.17) 
Ye@)l — Go] 


Wir bemerken, daß $,(x,) bei Gültigkeit der Hypothese H, auf Grund des 
Satzes von MoIVRE-LAPLACE die Normalverteilung 


Neo; Ve@nt < Ci lYr) 
hat. Wir erhalten daher schließlich aus (16.6.17) 


Y2x 
mit 
u erde ae Atön 
re@)L — E(&o)] veR@)l — Ctao)] 


E. Wir zeigen, daß der Kolmogoroffsche 7-Test bezüglich der Menge der stetigen 
Verteilungsfunktionen konsistent ist, die der Beziehung (16.6.14) genügen. In der 
Tat, die Funktion G (x) möge dieser Beziehung genügen und eine echte Verteilungs- 
funktion sein; dann haben wir 


d= sup |@l&) — Fola)j = sup |El&) — S,(2) + Sn) — Fol)! 
- X <r<o -R<Ie<Ro 


zs sup Cd) Sr sup IS) — Fol)! 


—-RO<L<R - S<I<RO 
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oder 
sup @)—-F,a)|25— sup |@(&) — S,(@). 


-X@O<T<o -O<E<o 


Nach dem Satz von GLIWENKo (vgl. 10.10) erhalten wir unter Beachtung der 
Tatsache, daß @(x) eine echte Verteilungsfunktion ist, 


P se sup [8,(2) — Fea)}z ’) ='1; (16.6.18) 


n>08 — O<ÄIE<0O 


Wir bezeichnen nun mit A, eine Zahl, die der Gleichung 


P(YnD, 2 4,)=« 


genügt. Es ist also 


lim M = lim | sup |S8,(2) — Fk&)| 2 An | se) : 


non Nn>00 -Xn<e<o Yn 


Aus dem Satz von KoLMOGOROFF (siehe 10.11) folgt 


lim A, = As: 


Für hinreichend große n ist daher }, ,/ Yn <.ö. Wegen (16.6.18) ergibt sich 


im M=1, 


Nn—X 


und der Kolmogoroffsche A-Test ist somit bezüglich der betrachteten Menge der 
alternativen Verteilungsfunktionen konsistent. 

Nach einem Verfahren, das dem auf den Kolmogoroffschen A-Test angewandten 
ähnlich ist, läßt sich für große 2 ein asymptotischer Ausdruck für die Güte des 
Tests gewinnen, welcher auf dem Satz von SMIRNOw (siehe 10.11) beruht, wenn 
wir die Hypothese A,[F,(x) = F,(x)] im Vergleich zur Alternativhypothese 
a sup |PF,(&)— F,(&)| =6>0]| testen; dabeisind F,(x) und F,(x) unke- 

-w<r<o 
kannte stetige Verteilungsfunktionen. Durch ähnliche Überlegungen wie vorhin 
läßt sich zeigen, daß der Smirnowsche A-Test bezüglich der Menge der stetigen 
Verteilungsfunktionen konsistent ist, die der folgenden Beziehungen genügen: 


sup IF,(&) - F,(a)| =ö5>0. 
-R<T<RO 
F. Wir wollen uns nun der Güte des Tests von WILCoxon-MANN-WHITNEX zu- 
wenden. Dabei wollen wir die gleichen Bezeichnungen verwenden wie in 12.6.B. 
Somit sind die Zufallsvariablen X, und X, unabhängig, wobei X, (i = 1,2) eine 
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stetige Verteilungsfunktion F,(x) hat. Wir stellen die Nullhypothese H,[F, (x) 
= F,(x)] auf. 

Nunmehr müssen wir die Alternativhypothese zu H, formulieren. Die Über- 
legungen in 12.6.B und insbesondere die Struktur des betrachteten Tests selbst 
suggerieren die Annahme von H, als Alternativhypothese, derzufolge für jedes 
reelle x, für das 0 < F,(x) <1 gilt, die Ungleichung 


F;(&) < F,(@) -(16.6.19) 


erfüllt ist. 
Wir wollen jedoch die allgemeinere Hypothese A, betrachten, derzufolge die 
Ungleichung 


0<p=P(X,-X,<0)< r (16.6.20) 


gilt. . 

Daß die Hypothese H, allgemeiner ist als die Hypothese H,, geht aus der Tat- 
sache hervor, daß aus der Gültigkeit der Ungleichung (16.6.19) für jedes x auch die 
Gültigkeit von (16.6.20) für jedes.x folgt. In der Tat, es ist dann (siehe 12.6.B) 


oo x 


1 
»= [Ft an < [Amar =, 


x oo 


Es liegen n, und n, unabhängige Beobachtungen der Zufallsvariablen X, und X, 
vor, und zwar 2, lb =1,2,...,n,) und 2; j =1,2,...,n,). Ausdiesen Beob- 
achtungswerten berechnen wir den Beobachtungswert u der Stichprobenfunktion 
U von MAns-WHITNEY und lehnen die Hypothese HZ, zugunsten der Alternativ- 
hypothese 7, ab, wenn u < u, gilt; hierbei ist « die Sicherheitswahrscheinlichkeit, 
und’, genügt der Beziehung 


y=P(U<u|H)<e. (16.6.21) 


Um die Güte dieses Tests zu ermitteln, beschränken wir uns auf große Stichproben 
und wenden die von LEHMANN [1] (vgl. 12.6.B) bewiesene Tatsache an, daß die 
Stichprobenfunktion U asymptotisch normal verteilt ist, und zwar hat die 
Stichprobenfunktion 


_U-E(W) 


V= 
YD:(d) 


(16.6.22) 


für na =sn, ($>0) und n,— oo die Normalverteilung N (0; 1), wobei K(U) 
und D®(U) durch die Formeln (12.6.17) und (12.6.18) gegeben sind. Wir lehnen . 
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somit die Hypothese HZ, ab, wenn der Wert (u — my)/o, <v, beobachtet wird. 
Herbei ist ®w,)=a und m, = E{UIH,) = 5 N,n, sowie. & = D?(U|H,} 


= 5 AıNg(n, + 0%, + 1). Die Größen w und v, stehen in folgendem Zusammen- 


hang. Wir setzen %, = My — 6,09. Dann haben wir 


Iimy=a limeo,=-v. 
N 02 


Die Güte dieses Tests erhalten wir somit nach der Formel 


Um m) ur 5 otm-—H } (16.6.23) 


M=P es <o, 


X) 


YPw) 


Beispiel 16.6.1. Es seien F,(x) und F,(x) stetige Verteilungsfunktionen. Mit Hilfe des 
eben beschriebenen Tests wollen wir die Hypothese H,[F, (x) = F,(x)] im Vergleich zur Alter- 
nativhypothese H,[F,(«) = Fi(x)] überprüfen, wobei k eine gewisse natürliche Zahl größer 
als 1 ist. Aus den Beziehungen (12.8.8), (12.6.17) und (12.6.18) finden wir 


i An 
ho Ein — — 
Be Dee 
) NN m, —1 2, —1 
DU) = ( ei k2 1}. 
. @+ipiE+2 | 2641 = 


Um zu numerischen Ergebnissen zu gelangen, seizen wir hir k= 2,2, =%,=25 und 
& = 0,05. Dann haben wir m, = 312,5 und o2 = 2656,25. Wir werden somit die Hypothese 
H, zugunsten der Alternativhypothese Y, ablehnen, wenn der beobachtete Wert z der Un- 


gleichung (uw — 312,5)/ 2856,25 < —1,64 genügt oder aber wenn «= 230 gilt. Gilt die 


Alternativhypothese, so ist E{TT) = 208 I und D?(U) = 2180 ER Aus (16.6.23) erhal- 
ten wir M = ©(0,485) = 0,8866. a 9 

Hätten wir in diesem Beispiel x, = n, == 60 gewählt, so hätte sich M zu etwa 0,95 ergeben 
(siehe L&EHMARNN [3]). 


‚Dem Problem der Güte des Tiests von WILCoxon-MAnNn-WHITNEY und dem 
Vergleich dieser Güte mit der Güte anderer niehtparametrischer Tests sind Arbei- 
ten von VAN DER VAART j1], VAN DER WAERDEN [2], van Dantzie [i] und LEHMANN 
[3] gewidmet. 

Die Ergebnisse dieser Arbeiten scheinen auszusagen, daß die Güte des Tests 
von WILCoxon-MANnN-WHITWEY besser ist als die Güte der anderen von uns be- 
trachteten nichtparametrischen Tests. 


6. Wir wollen nun zeigen, daß bei Verifizierung der Hypothese A, [F,@)=F;(zn)] 
im Vergleich zu der durch (16.6.20) gegebenen Alternativhypotkese der Test von 
WrLcooxon-MAnn-WHITNEY konsistent ist. Beim Beweis werden wir die beiden 
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nachstehenden Ungleichungen verwenden, die sich unmittelbar aus (12.6.13) und 
(12.6.14#) herleiten lassen: 


0<p= [FEidF@)—-pe= [FdF@)—p=p—p 
=p(l-p), 


x R 
s [IP AR) P=1-U-pM—-pP=pl-p). 
Aus diesen Ungleichungen und aus (12.6.18) folgt 


DD) _ „mr +m-Nr»+pl-p 


ei ; Hm r | 
< 2pi1—- Pin +, —1) <12pll —p). (16.6.24) 
rn tn +1 


Nun bestimmen wir die Testgüte und erhalten 


.1-M=P(U>u!H,=P(U>m, — c,0,'H,) (16.6.25) 
1 
= P (v — NP > (3 —_ ») NıNg nr). 


Wir bemerken, daß wegen (16.6.20) die Differenz 5 — p positiv ist. Da ferner c, 


beschränkt ist und n, = sn, (s >0) gilt, ergibt sich für hinreichend große n, 
1 j FREE | ge 
F —- Pin — cn = Fi —p u 


Wenden wir nun auf die rechte Seite von (16.6.25) die Tschebyscheffsche Un- 
gleichung an (siehe 3.3), so erhalten wir 


2(7 (U 2 ur 
an nm = en | 
(3 — ») NR, — en) X 4 Tat 


Im Einklang mit (16.6.24) ist der Ausdruck D2(U)/o} beschränkt. Beachten wir 
wiederum die Beziehung (16.6.20), die Beziehung nr, = sn, sowie die Tatsache, 
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daß c, beschränkt ist, so sehen wir, daß der Ausdruck innerhalb der äußeren 
Klammer auf der rechten Seite der letzten Ungleichung für rn, > ® über alle 
Grenzen wächst, und es ist somit 


lim(1-M) =0. 


NIX 


j 1 
Schließlich erhalten wir daher für p < 5 


lim P(U<u|RA,) =1. 


2,00 


Damit ist die Konsistenz des Tests von WILCOXOX-MANN-WHITNEY bewiesen. 
Es sei jedoch erwähnt, daß bei Verifizierung der Hypothese H,[F, (x) = Fa(x)] 


. r . # [2 Tr. 1 x 

im Vergleich zur Alternativhypothese 4 E RE F,(e),pZ = der Test von 
WILCOXON-MANN-WHITNEY nicht konsistent ist. In der Tat, aus (16.6.25) erhalten 
wir 


M=P(U<u|H)= r(v —_ MMP<— (r- .) NıNg + «| "). 


1 1 
Da pz Fr und ce, für jedes x < 3 (außer für sehr kleine n, und n,) positiv ist, 


gilt (? —_ | NıNg + 6,09>0. Aus der Tschebyscheffschen Ungleichung er- 


halten wir daher 


a R 5 ua 2 
M< n 2) L (( = 3) een + | 
(? = 3) NN 6, | £ : = ; 


Beachtet man, daß D®(U)/o5 sowie der Ausdruck innerhalb der eckigen Klammer 
der letzten Bezichung für n, — co über alle Grenzen wächst, so folgt 


lim M =0. 


N>X 
: 1. =. ; $ 
Somit ist im betrachteten Fall p> = dieser Test nicht konsistent, wa& durch- 


aus auch unserer intuitiven Vorstellung entspricht. 

Diese Ergebnisse’über die Konsistenz des Tests von WILCOXxoN-MANN- WHITNEY 
stammen von van Dantzıe [1] (vgl. auch LeHmann [2] und R£xvi |10]). Die 
Konsistenz dieses Tests bezüglich der Menge der Verteilungsfunktionen, die 
(16.6.19) genügen, zeigten MAnx und WHITNEX [1]. 
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Das nachstehende, von GNEDENKOo [11] angegebene Beispiel veranschaulicht die 
Inkonsistenz des Tests von WILCOXxon-MANN-WurTNEY im Fall p= - 
Beispiel 16.6.2. Die Verteilungsfunktionen F, (x) und F,(x) seien stetig und mögen den 
Bedingungen 
0 für z<ae, 


F(x) = 


0 für zsb, 1 
F,(x) = a bEx<sc, 


1 für ze, 
it für z2d 
mit a<b<c<.d genügen. Wir haben hier j 
x % 
1 1 
?= | FrtdR) = — (Fe) — Fıb)) => 


X 


Entnehmen wir jeder dieser Gesamtheiten Stichproben, so (wir benutzen hier die gleichen 
Bezeichnungen wie bisher) gilt 
n 1 : 1 
EU) = Zt De le 
Man erkennt sofort, daß für große r, und n, die Hälfte der beobachteten Werte von 
2; 4=1,2,...,n0,) im Intervall [a, 5] liegt, und für diese gilt somit z,; < x,,. Wir werden 


1 . 
“ daher Werte der Stichprobenfunktion U beobachten, die nahe bei >04 liegen. Beim 


Überprüfen der Hypothese H,[F,(x)= F,(x)] im Vergleich zur Alternativhypothese 


1 
IH, Ir ()=#$F,(e),p = A mit Hilfe des Tests von WILcoxon-Mann-WHITnEy würde 


man zu der Annahme der falschen Hypothese H, sogar bei verhältnismäßig großen Wer- 
ten von n, und n, geführt. 

H. Der bisher betrachtete Test von WILCOxox-MANN-WHITNEY ist einseitig, denn 
die Alternativhypothese wird entweder durch (16.6.19) oder durch (16.6.20) 
gegeben. Man kann auch einen zweiseitigen Test von WILCOXon-MANNn-WHITNEY 
betrachten, bei welchem die Nullhypothese nach wie vor die Hypothese 
H,IF,(x)= F;(x)] bleibt, während die Alternativhypothese die Hypothese 


H,[F,(@)=F,;,(x)] oder H, (? => 5) ist. Nun ist wie folgt zu verfahren. Für 


kleine r, und z, bestimmen wir zwei Zahlen u, und x, derart, daß die Stichproben- 
funktion U von MAnN-WHITNEY im Fall der Gültigkeit von H, den Beziehungen 


PU<SWSZ. PUSWS-. 


genügt, wobei & die Sicherheitswahrscheinlichkeit ist. Wir lehnen die Hypothese 
H,ab, wenn der beobachtete Wert u der Stichprobenfunktion U einer der beiden 
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Ungleichungen u <u, oder u> u, genügt. Für große n, und n, verwenden wir 
die Normalapproximation und lehnen die Hypothese HZ, ab, wenn der beobachtete 
Wert v der durch (16.6.22) definierten Stichprobenfunktion V der Beziehung 


|v| 2 v,;, genügt, wobei wir den Punkt v,, aus der Gleichung ®(v,,.) = r & 
bestimmen. 

Unsere Betrachtungen zur Güte und Konsistenz des einseitigen Tests von MANX- 
WHITN®eY lassen sich ohne Schwierigkeiten auf den zweiseitigen Test von Manx- 
WHırney übertragen. Insbesondere ist der Test von MAnn-WHIrNEy konsistent, 


1 
wenn H,l[F,(2) = Fz(x)] die Nullhypothese und H, B (2) = FPy(&), P=# 2 
die Alternativhypothese ist. 2 


16.7. Schlußbemerkungen 


In den Arbeiten von WoLFOWwITZz [4], HoEFFDING [1] und LrHmann [3] findet der 
Leser viele Informationen über die Güte und Konsistenz des Tests von WALD- 
WoLFrowıTz und anderer nichtparametgischer Tests. Dem Problem der Güte des 
4-Tests von PEARSON ist ebenfalls eine Arbeit von Mann und WALD [1] gewidmet. 
Die Arbeiten von BARToN, DAvID und MALLows [1] sowie von BARTON und DAVID 
[1] behandeln das Problem der Anwendbarkeit des Tests von WILCOXoN-MANN- 
WHITNeEy und des Tests von WALD-WoLFOWITZ zur Verifizierung des Tests über 
die Zufälligkeit einer Folge von Beobachtungen, die Elemente von zweierlei Art 
enthalten (vgl. Beispiel 14.2.3), sowie die Güte dieser Tests bei verschiedenen 
Alternativhypothesen. 


16.8. Aufgaben und Ergänzungen 


1. Der Parameter o in einer Grundgesamtheit, in der das Merkmal X die Normalverteilung 
N(0;0) hat, ist unbekannt. Die Nullhypothese ist H,(o = o,) und die Alternativ- 
hypothese H, (o = o,). Man zeige, daß ein bester Test zur Überprüfung von H, im Vergleich 
zu H, anhand von Stichproben in diesem Fall die Menge w’ ist, die durch die Ungleichungen 


=?+2<b für 9>0, =+82Zb für ,<o, 
bestimmt ist; hierbei ermitteln wir die Konstante b aus der Bedingung P(£ € w’]o,) = a. 
Man vergleiche hierzu das Beispiel 16.3.3. 
2. Das Merkmal X habe die Dichtefunktion 
ji JPe@T-Pe nl für a-y20, 
x) = 
lo für 2—-y9<0. 
Die Parameter 8 und y sind unbekannt. Wir betrachten die Hypothesen HB = Pu 
y=9,) und H,(ß = ß,y = Yı), wobei die Menge der zulässigen Alternativhypothesen 


durch die Ungleichungen y, <y, und ß, =, bestimmt ist. Man zeige (NEYMan und 
Pzarson [5]), daß ein bester Test zur Verifizierung der betrachteten Hypothesen der 
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a 


kritische Bereich «’ = wy + u, ist, wobei zu «] die Punkte x < >, und zu ır, die 
Punkte & gehören, die der Ungleichung 


a< | B Bu eg A 
men, YoPo eg 4 


genügen; dabei bestimmen wir die Konstante A aus der Sicherheitswahrscheinlichkeit «. 


Man beachte, daß dieser Test ein gleichmäßiger bester Test bezüglich 8 und y ist. 
Man betrachte den Spezialfall, daß x die Exponentialverteilung mit y= 0 hat. 


. Die Dichtefunktion /(&,g) hängt von dem unbekannten Vektor q = (9,03 -..,Q@,) ab. 


Wir bezeichnen mit g, bzw. q; die Vektoren (Qo Qao ++» @ro) bzw. (Qiy Qay -:-, Q,,) und 
verifizieren die einfache Hypothese H,(g = g9,) im Vergleich zur einfachen Alternativ- 
hypothesse H,g=q) mit ea. 

Man zeige: Existiert ein gleichmäßig bester Text bezüglich der Klasse a aller Alternativ- 
hypothesen, so läßt er sich auf der Grundlage der Schätzfunktion g*(£) = (+ (&), 
QFUE),...,Q* (&)) des Vektors q konstruieren, die man nach dem Maximun-Likelihood- 
Prinzip erhalten hat, wobei der Definitionsbereich des Vektors g die Menge a ist. 


. (Wegen der Bezeichnungen siehe 16.3.D.) Es möge f(&,@), wobei Q eine beliebige reelle 


Zahl ist, die Dichtefunktion (wenn & vom stetigen Typ ist) oder die Wahrscheinlichkeits- 
funktion (wenn & diskret ist) des Zufallspunktes & bezeichnen. Wir wollen annehnien, 
daß f(£,0) sich in der Form ; 


f&,0) = C(Q) exp [g(O) T(E)IR(E) *) 


darstellen läßt, wobei g(Q) streng monoton wächst. Man zeige, daß zur Verifizierung 
der Hypothese H,(@=Q,) im Vergleich zur Alternativhypothese H,(Q@ > Q,) ein gleich- 
mäßig bester verallgemeinerter Test existiert, der durch die Testfunktion. 


1 für T()>e, 
pH) =iy fr Td)=e, er) 
0 für T)<e 


definiert ist; die Konstanten y und c werden hierbei aus der Gleichung 


PIT(&) > clQ = Ro] + YPIT(E) = clQ = Qu] = a 


bestimmt. Falls die Funktion g(@) monoton fallend im strengen Sinne ist, während alle 
übrigen Bedingungen unverändert bleiben, sind in der Formel (**) die beiden Ungleich- 
heitszeichen zu vertauschen. 


. Es möge x die Binomialverteilung gemäß (5.2.1) haben, und es sei p unbekannt. Man 


stelle die rechte Seite von (5.2.1) in der Form (*) gemäß der vorhergehenden Aufgabe dar 
und ermittle einen gleichmäßig besten Test zur Überprüfung der Hypothese H,(p < pı) 
im Vergleich zur Hypothese H,(p > p,). mit der Sicherheitswahrscheinlichkeit a. 


. Es möge x die Normalverteilung N (m; 0) haben. 


a) Wir wollen annehmen, daß m unbekannt und o bekannt ist. Man verwende die Ergeb- 
nisse der Aufgabe 4, um einen gleichmäßig besten Test zur Überprüfung der Hypothese 
H,(m < m,) im Vergleich zur Hypothese H, (m > m,) zu ermitteln. Man vergleiche 
den gewonnenen Test mit dem in 16.4 besprochenen Test. 


16.8. Aufgaben und Ergänzungen 671 


7. 


10. 


b) Nun nehmen wir an, daß m bekannt und a unbekannt ist. Man bestimme einen gleich- 
mäßig besten Test zur Überprüfung der Hypothese //,(0 < o,) im Vergleich mit der 
Hypothese ZI,(o > o,). Man vergleiche hierzu Aufgabe 1. 


Es möge f{&,@) die gleiche Bedeutung haben wie in Aufgabe 4 und sich in der Form (*) 
der genannten Aufgabe darstellen lassen. Zur Überprüfung der Hypothese H,(Q = 0, 
oder Q>0Q,) im Vergleich zur Hypothese 7,(0, <Q@<Q,) existiert ein gleichmäßig 
bester Test, der durch die Testfunktion z 


1 für. <T(&)<c,, 
ge) = 37 für T)=5li=l2), 
8° für T(H)<ce, ode T($)>e, 
gegeben ist; dabei werden die Konstanten Y,, 72. €, €, aus der Gleichung 
Pla< TO)<aiQd=Q]l + MPITE = ce = Wi] 
+9%P[IT)=Q=Q)l=a G=1,2) 


bestimmt. 


. Man verwende das Ergebnis der vorhergehenden Aufgabe, um einen gleichmäßig besten 


Test zur Überprüfung der Hypothese H,(m S m, oder ın > m,) im Vergleich zur Hypothese 
H,(m, <m<m,) zu bestimmen, wobei m der unbekannte Mittelwert der Normal- 
verteilung N (m; 1) ist. 


. Man zeige: Ist g(&) die Testfunktion im Problem der Überprüfung einer Hypothese 


bezüglich Q und ist U eine erschöpfende Schätzfunktion des Parameters 9, so ist Z[p (E) | U] 
ebenfalls eine Testfunktion, deren Gütefunktion gleich der Gütefunktion von (£) ist. 


Die Dichtefunktion f{£, q) möge von dem unbekannten Vektor q = (Qy Qa ++-» Or Qrrı) 
abhängen. Die zusammengesetzte Nullhypothese 4,(Q, = Quo ---» Or = Pr) möge den 
Wert des Parameters Q,.., nicht spezifizieren. Wir setzen 9 = (yo - --» Oro Yr4ı)- Ferner 
mögen a und A die Menge der Vektoren g, und den Parameterraum darstellen. Wir setzen 
voraus, daß a) /(£, q,) hinreichend oft nach Q,., für nahezu alle Werte von Q,,, differen- 
zierbar ist und daß b) die Beziehung 


& log FE, 9) m E log F(S, 90) 
en? 5 4 ' B 2 
Ei Cdrzı 


gilt, wobei 4 und 3 zwar von Q,+,, jedoch nicht von & abhängig sind. 

Man zeige, daß die Menge w im Stichprobenraum für jede Sicherheitswahrscheinlichkeit a 
dann und nur dann ein dem ganzen Stichprobenraum ähnlicher Bereich bezüglich a 
ist, wenn für k=1,?2,... die Beziehung 


öhf(E, 9) BE 
f Zen 


w 
gilt. ; 
Wir verwenden einen Test, der auf dem Maximum-Likelihood-Prinzip beruht: Die Dichte- 
funktion f(&, g) möge von dem unbekannten Vektor q == (Our... On Qrin sr Qris) ab- 
hängen. Die Dichtefunktion f(&, g) ist die Likelihood-Funktion (vgl. 13.7.A). X möge die 
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11. 


12. 


13. 


14. 
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Menge aller Vektore.u q und a die Menge aller Vektoren 9% = (Gi +5 do» Qrsn ++» Qrrs) 
bedeuten, wobei Qjo -:-» @r, fest sind, während alle übrigen Q beliebig sind. Wir wollen 
die Hypothese A,(q € a) überprüfen. Hierzu setzen wir 


sup f{&, q) 
a 


l=———. * 
IE, 9) | 2 
a 


Der auf dem Likelihood-Verhältnis beruhende Test lehnt die Hypothese H, ab, wenn 
ASA ist, wobei AZ aus der Beziehung 


supPA<sAlgeo)=a (**) 
a 


bestimmt wird. 

Wir bemerken, daß die Beziehung (**) schwächer ist als die Ähnlichkeit zum ganzen 
Stichprobenraum bezüglich der Menge a. 

Für Zufallsvariable vom diskreten Typ läßt sich ein auf dem Likelihood-Verhältnis 
beruhender Test in analoger Weise konstruieren. Es ist dann allerdings die Dichte- 
funktion f(&,g) durch die entsprechende Wahrscheinlichkeitsfunktion zu ersetzen. 


Es mögen r normale Gesamtheiten N {m,; 0;) = 1,2,...,r) vorliegen, und es reien aus 
diesen Gesamtheiten r einfache Stichproben von jeweils dem Umfang: n; ausgewählt, 
wobei 9 +23 ++ n, = N gilt. Wir bezeichnen mit &, bzw. mit s? den Erwartungswert 
bzw. die Varianz der ö-ten Stiehprobe. Die Nullhypothese Z,{m, = m, == m,; 
09, =0, == 0,) spezifiziert weder den Erwartungswert noch die gemeinsame Varianz, 
während die Alternativhypothese F, sämtliche reellen m; und positiven o, zuläßt. Man 
zeige, daß das Likelihood-Verhältnis die Form 


r & n/2 
u) 


i=1 \86 
T 2 
mit d= = Zul, — 2)? + 8], wobei = — Zur. ist. 
i= i= 


(Fortsetzung). Wir behalten sämtliche Bezeichnungen und Voraussetzungen der vorher- 
gehenden Aufgabe bei mit Ausnahme der Hypothese ZH, an deren Stelle wir die Hypothese 
Ho(o, = 0, =" = 0,) ansetzen. Man zeige, daß 


An 


2 
I 


1 T 
mit 2 = — ns gilt. 
NZ 


Man beweise: Sind die Parameter m und o in einer normalen Grundgesamitheit unbekannt 
und wird o von der Hypothese H,(m = m,) nicht spezifiziert, so führt der auf dem 
Likelihood-Verhältnis beruhende Test auf den Studentschen i-Test. 


Man beweise: Sind die Parameter m,, co, und z,, o, in den normalen Grundgesamtheiten 
N (m,; o,) und N (m,; o,) unbekannt, so gelten die folgenden Behauptungen: 
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15. 


16. 


17. 


18. 


19. 


a) Die Verifizierung der Hypothese H,(o] = 0,) (ohne irgendwelche Voraussetzungen 
über m, und m,) führt bei Anwendung des Likelihood-Verhältnisses auf einen Test, 
der auf der Fisherschen Z-Verteilung beruht. \ 

b) Die Verifizierung der Hypothese H,(m, = m,) (wobei bekannt ist, daß o, = o, gilt) 
führt bei Anwendung des Likelihood-Verhältnisses auf den Studentschen :-Test. 


Es möge x die Normalverteilung N (m; co) mit den Unbekannten m und o haben. Wir 
betrachten die zusammengesetzte Hypothese H,(o < o,) im Vergleich zur Hypothese 
H,(o > o,), wobei weder H, noch H, den Wert von m spezifiziert. Man zeige, daß der 
Test, der die Hypothese 4, für s®®> c ablehnt, wobei c ausder Gleichung P[s?>c|o = o,] 
= & bestimmt wird, ein gleichmäßig bester Test ist. Man vergleiche hierzu Aufgabe 6b. 
Es möge f{€,@) die gleiche Bedeutung haben wie in Aufgabe 4 und sich in der Form (*) 
dieser Aufgabe darstellen lassen. Man zeige, daß zur Überprüfung der Hypothese 
H,(Qı SQ SQ.) im Vergleich zur Hypothese H,(Q <Q, oder Q > Q,) ein gleichmäßig 
bester unverfälschter Test existiert, der durch die Testfunktion 


1 für T)<c, oder T(E)> co, 
ed) 3 fr TO)=u; (Ü=Ll2), *) 
0 für a <Te)<e 


gegeben ist; die Konstanten c,, 63, Y1, Ya werden hierbei aus der Gleichung 
Ep@\Q=Q1=« =1,2) 


bestimmt. 


Es möge f{£,g) die gleichen Eigenschaften haben wie in der vorhergehenden Aufgabe 
Man zeige, daß zur Verifizierung der Hypothese H,(@ = Q,) im Vergleich zur Hypothese 
H,(@=+Q,) ein gleichmäßig bester, unverfälschter, durch die Testfunktion (*) von 
Aufgabe 16 gegebener Test existiert, wobei die Konstanten c,, C,, 1, Ya aus den Gleichungen 


Er@lQ=9l=a, ETGYHIQ =] = sELTIQ = As] 
bestimmt werden: 


Es möge x die Normalverteilung N (m; 0) mit unbekanntem m und o haben. 


a) Man zeige, daß für die Hypothese H,(o = o,) im Vergleich zur Hypothese H,(o < o,), 
wobei beide Hypothesen Z, und H, den Wert m nicht spezifizieren, der Test, der die 
Hypothese H, für (s?/o?)< c ablehnt, wobei c aus der Gleichung P(#2<o2c)=« 
bestimmt wird, ein gleichmäßig bester unverfälschter Test ist (vgl. hierzu Aufgabe 
15). 

b) Man zeige, daß die gleichmäßig besten unverfälschten Tests zur Überprüfung der 
Hypothese H,(m < m,) im Vergleich zur Hypothese H,(m > m,) oder der Hypothese 
H,(m = m,) im Vergleich zur Hypothese H,(m = m,) für den Fall, daß o weder 
durch H, noch durch H, spezifiziert wird, auf dem Studentschen t-Test beruhen. 


Es seien x, und x, unabhängige Zufallsvariable, beide mit der Poissonverteilung, und es 
möge x; den Mittelwert A; (@=1,2) haben. Wir wollen die zusammengesetzte Hypothese 
H,(A,=,) im Vergleich zur Hypothese H,(A, #4,) überprüfen. Man leite einen gleich- 
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mäßig besten Test zur Überprüfung dieser Hypothese her (Przysorowskı und 
WILENSKI [1]). 


20. (Bezeichnungen von 16,5). Der Test zur Überprüfung der einfachen Hypothese H,(Q=Q,) 


21. 
22. 


23. 


4. 


im Vergleich zur Alternativhypothese H,(@ = @,) heißt unverfälschter Test vom Typ A 
mit der Sicherheitswahrscheinlichkeit «, wenn die Beziehungen (16.3.5) und (16.5.5) sowie 
die Beziehung 


0M (w, 
FM (wQ) >= max (*) 
80° ja=@ 
erfüllt sind. Man zeige: Sind die Voraussetzungen des Satzes 16.5.1 erfüllt, existiert dar- 
ORflE, 
über hinaus die Ableitung &(&Q)= - = in jedem inneren Punkt Qe K und 


gilt für jede Menge w im Stichprobenraum die Gleichung 


re a: = [reo.. 


so existiert unter den unverfälschten Tests vom Typ A ein bester Test w, zu dem die 
und nur die Punkte & gehören, für die 


(E00) 2 ahl& &) + afl& 9) (**) 


gilt. Die Konstanten c, und c, bestimmen wir so, daß die Beziehungen (16.3.5), (16.5.5) 
und (*) erfüllt sind (NrYmAn und Prarson [4]). 


Man zeige, daß der beste unverfälschte Test im Beispiel 16.5.2 vom Typ A ist. 


Das Merkmal X habe die Normalverteilung N(0;0). Wir wollen die Hypothese 
H,(o = 0,) im Vergleich zur Alternativhypothese H,(o = co, -+ 0,) überprüfen. Man 
konstruiere hierzu einen besten unverfälschten Test vom Typ A. 


Die Zufallsvariable X, (# = 1,2) möge die stetige Verteilungsfunktion F;(z) haben. Wir 
bezeichnen mit 2, (l=1,2,...,2,) und 2,5=1,2,...,n,) unabhängige Beobachtungen 
der Zufallsvariablen X, und X, und mit y„ (m =1,2,...,%, + n,) die in aufsteigender 
Reihenfolge angeordneten Werte x,; und 2,;; mM, Ma, ..-, M,, seien die Ränge dieser y,, 
die den %,; entsprechen. Mit M, (s=1,2,...,,) bezeichnen wir Zufallsvariable, die die 
Werte m, durchlaufen. Man zeige (Hosrroıng [1], Leamans [3]): Gilt F,(&) = g[F, (®)], 
wobei g eine stetige differenzierbare und nicht fallende Funktion und g(0) = 0 sowie 
gi)=1 ist, so gilt, 


n,!'n,! 


P(M, = m, ..., My, = Mm.) = ee E|g (un,) ng? (&m,,)); (@) 


dabei bedeutet w„, (=1,2,...,n,) den Wert der Positionsstichprobenfunktion & (nı+n2) 
in einer einfachen Stichprobe aus einer im Intervall [0, 1] gleichverteilten Grundgesamt- 
heit. 


(Fortsetzung). Man zeige (LEHMmanx [3]): Ist F,(x)=[F,(«)]! (k eine natürliche Zahl), 


25. 


26. 
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so hat die rechte Seite der Formel (*) die Gestalt 


N,!n,! Pr m I'm; + ks — s) I’ (ms) 
(rn + nz)! soı I (ms + %s—s) I(m,) " 


Unter einem Rangtest verstehen wir beim Problem zweier Stichproben einen Test, der 
lediglich von den beobachteten Rängen m,, my, ..., M,, abhängt. . 

Man konstruiere einen besten Rangtest zur Überprüfung von H,[F,(«) = F,(x)] im 
Vergleich zur Alternativhypothese H, [F: (x) = g[F, @)ll wobei g die in der Aufgabe 
23 genannten Eigenschaften hat (Leamann [3]). 


(Fortsetzung). Man konstruiere einen besten Rangtest, um dieHypothese H,[F, («)=F,(x)] 
im Vergleich zur Alternativhypothese H,|r, @)=(1-a)Flk) + a(F | zu prüfen, 
wobei O<asi1 ist (Lemmann [3], J. BR. Savage [1] und Uautmann [1]). 


17. ELEMENTE DER SEQUENTIALANALYSE 


17.1. Einleitende Bemerkungen 


A. Beim bisher besprochenen Testverfahren zur Überprüfung von Hypothesen 
war der Stichprobenumfang konstant. Bei einem derartigen Vorgehen nutzen wir 
gewöhnlich nicht die gesamte Information aus, die uns eine Stichprobe gibt. 
In der Tat, der Stichprobenumfang ist ja davon unabhängig, welche Elemente 
man als erste ausgewählt hat. 

Leicht lassen sich Beispiele angeben, wo ein derartiges Verfahren offensicht- 
lich ungünstig in dem Sinne ist, daß wir mehr Elemente als nötig auswählen. 
Betrachten wir zum Beispiel eine Gesamtheit, in der das Merkmal & normal 
N (m; 1) verteilt ist, wobei der Mittelwert m unbekannt sei. Wir wollen die Hypo- 
these H,(m = 0) testen. Zu diesem Zweck entnehmen wir der Gesamtheit eine 
Stichprobe vom Umfang r. Wir nehmen an, daß alle » — 1 zuerst gewählten 
Elemente in der Nähe des Wertes x —=5 liegen. Da die Standardabweichung 1 
beträgt, ist es klar, daß die Wahl des n-ten Elements unsere Entscheidung über 
die Ablehnung der Hypothese HZ, nicht beeinflußt; denn die Wahrscheinlichkeit 
dafür, im Fall m = 0 nacheinander n — 1 Elemente in der Nähe von x —=5 
zu erhalten, ist äußerst klein. Dieses Beispiel ist selbstverständlich nicht typisch, 
doch zeigt es äußerst klar den Nachteil eines Prüfverfahrens, in dem der Stich- 
probenumfang vorgegeben ist. Ganz anders liegen die Dinge bei einem sequen- 
tiellen Verfahren zur Prüfung einer Hypothese. Dieses Verfahren wollen wir im 
folgenden behandeln. 


B. Ein sequentielles Verfahren zur Nachprüfung einer statistischen Hypothese 
nennt man ein Verfahren, bei dem der Stichprobenumfang nicht vorgegeben ist, 
sondern bei dem der Wert eines jeden neugewählten Elements darüber entscheidet, 
ob die zu verifizierende Hypothese anzunehmen oder abzulehnen ist oder ob die 
Untersuchung weiter fortgesetzt werden soll, d. h., ob ein weiteres Element in die 
Stichprobe gewählt werden soll. Ein bei einem sequentiellen Verfahren ange- 
wandter Test heißt Sequentialiest. 

Die Problematik, die sich mit sequentiellen Prüfverfahren von statistischen 
Hypothesen’ befaßt, nennt man Sequentialanalyse. 

Als Vorläufer der Begründung der Sequentialanalyse dürften wohl Dopez und 
Bonmig [1] anzusehen sein, die ein Schema einer zweistufigen Auswahl konstruiert 
hatten, bei dem von den Ergebnissen der ersten Stichprobe abhängig gemacht 
wird, ob noch eine zweite Stichprobe zu entnehmen ist. BARTKy [1] betrachtete im 
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Spezialfall der Überprüfung einer Hypothese in bezug auf den Erwartungswert 
einer Binomialverteilung ein Schema, das dem Schema des sequentiellen Quotien- 
tentests ähnlich ist; dieser Test soll in 17.2 besprochen werden. Der Schöpfer der 
Theorie der Sequentialanalyse, auf den auch viele Anwendungen der Ergebnisse 
dieser Theorie zurückgehen, ist Waup. Die Grundideen der Sequentialanalyse 
sowie viele Anwendungen derselben findet der Leser in den Arbeiten von WALD 
[2], [4- 

Ehe wir zu speziellen Betrachtungen übergehen, untersuchen wir die Frage, 
ob es möglich ist, daß die aufeinanderfolgenden Elementeuntersuchungen immer 
eine Fortsetzung des Verfahrens verursachen, aber keine Möglichkeit zur Ent- 
scheidung geben, ob die Hypothese abgelehnt oder angenommen werden soll. 
Solche Tests sınd zwar theoretisch möglich; sie haben aber keine praktische 
Bedeutung. Die Sequentialtests, die wir betrachten wollen, haben die Eigenschaft, 
daß bei ihrer Anwendung die Wahrscheinlichkeit dafür, nach endlich vielen 
Beobachtungen eine Entscheidung treffen zu können, gleich 1 ist. 

Einen Sequentialtest wollen wir (wie in der bisherigen Testtheorie) mit Hilfe 
der Gütefunktion oder auch mittels der Operationscharakteristik kennzeichnen. 
Außerdem wird er noch durch den mittleren Stichprobenumfang charakterisiert. Dic 
Anzahl n der Beobachtungen, die für ein sequentielles Verfahren zur Entscheidung 
nötig sind, ist hier eine Zufallsvariable; diese Anzahl kann für jeden Versuch 
verschieden ausfallen. Der gegebene Sequentialtest wird durch den Durchschnitts- 
wert dieser Zufallsvariablen!) charakterisiert: Ein Test ist um so besser, je kleiner 
die durchschnittliche Beobachtungsanzahl bei seiner Anwendung ist. 
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In diesem Kapitel wollen wir die folgenden Bezeichnungen benutzen: Die Ver- 
teilung einer Zufallsvariablen x hänge vom Parameter Q ab; mit f(x, Q) wollen 
wir die Dichte von Zufallsvariablen x bezeichnen, wenn x stetig ist, während für 
diskretes x mit f(x,Q) die Wahrscheinlichkeitsfunktion der Zufallsvariablen x 
bezeichnet werden soll. 

Wir beschreiben jetzt einen speziellen sequentiellen Test, nämlich den sequen- 
tiellen Quotiententest. Der Wert des Parameters Q in der Funktion f({x,Q) sei 
unbekannt. Wir stellen die Hypothese H,(@ = @,) auf und wollen sie gegen die 
Alternativhypothese HZ, (@ = Qı) testen; dabei sei Q, ein gewisser von Q, ver- 
schiedener Wert. Wie bisher sollen x bzw. 8 die Wahrscheinlichkeiten für einen 
Fehler erster bzw. zweiter Art bezeichnen. In Abhängigkeit von den Zahlen & und 
$ bestimmen wir zwei Zahlen A und B, fürdie O<B<1<A ist. (Wieman diese 
Zahlen bestimmt, wollen wir später besprechen.) 


1) Wir beschränken uns hier auf Fälle, in denen dieser Durchschnittswert endlich ist. 
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Wir entnehmen dieser Gesamtheit eine einfache Stichprobe. Wir stellen uns vor, 
daß wir eine Beobachtung besitzen, die mit x, bezeichnet sei. Weiter sei. 


Pıı = Mau Qı)» Poı = Han 20): (17.2.1) 


So ist also p,, im Fall einer diskreten Zufallsvariablen die Wahrscheinlichkeit 
dafür, daß x =, ist, während 7, im Fall einer stetigen Zufallsvariablen der 
Wert der Dichte im Punkt x =, ist, wenn die Hypothese H, richtig ist. Ähn- 


liche Bedeutung hat ?,,- Wir betrachten den Wert des Quotienten Pi, 
Wenn dieser Quotient nun die Ungleichung m 
Pu > 4 
Pa 


erfüllt, lehnen wir die Hypothese Z, zugunsten ihrer Alternativhypothese Z, ab; 
wenn dagegen 


Pu <BR 
Pa 


ist, nehmen wir die Hypothese H, an; ist schließlich 


B<tu <A, 
Poı 


so wählen wir in die Stichprobe noch ein Element, das mit x, bezeichnet sei. 
‘Wir setzen weiter 


Pı2 = Man Aı)fl&a Qı)», Po = Man Qo)fl&a; 20) 


und verfahren ähnlich wie oben, d.h., wir lehnen die Hypothese HZ, ab und 
nehmen die Hypothese Z, an, wenn 22 > A ist; wirnehmen die Hypothese H, 


Po2 
an, wenn Pır <.B ist; schließlich nehmen wir eine dritte weitere Beobachtung, 
Poa 
wenn die Ungleichungen 


B<E® <A 
Po2 
bestehen. - 
Falls eine Stichprobe, die aus m — 1 Elementen besteht, keine Entscheidung 
zu fällen erlaubt, entnehmen wir der Gesamtheit ein m-tes Element, und das 


17.2. Der sequentielle Quotiententest . i 679 


weitere Vorgehen hängt vom Wert des Quotienten 


Pım a1, Qı) Fe Qi) am: Qı) 


Pom fa, Qflze 20) ee Q,) 


ab. Ist nämlich 


a 2A: 
Pom 


so lehnen wir die Hypothese H, zugunsten der Hypothese A, ab, ist dagegen die 
Bedingung 


Pım <BR 
Pom 


erfüllt, so nehmen wir die Hypothese Z, an. Endlich wählen wir ein weiteres 
Element in die Stichprobe, wenn die Beziehung 


Bern 24 
Pam 
besteht. 


Dieses Prüfverfahren von Hypothesen nennt man den sequentiellen Quotienten- 
test. 

Das hier beschriebene Verfahren erfordert die Beantwortung der folgenden 
Fragen: - 

1. Wann ist die Wahrscheinlichkeit dafür, daß das Verfahren nach endlich 
vielen Schritten zu einer Entscheidung führt, gleich 1? 

2. Wie bestimmt man die Operationscharakteristik dieses sequentiellen Quotien- 
tentests? 

3. Wie findet man die mittlere Anzahl Z(n) der Beobachtungen, Jie zu einer 
Entscheidung nötig sind? 

4. Wie bestimmt man A und B in Abhängigkeit von & und 8? Wie soll man sich 
also vergewissern, daß die Wahrscheinlichkeiten für einen Fehler erster bzw. 
zweiter Art gleich x bzw. ß im Fall einer stetigen Zufallsvariablen und nicht 
größer als x bzw. $ im Fall einer diskreten Zufallsvariablen sind? 


In den weiteren Darlegungen wollen wir uns bemühen, diese Fragen zu beant- 


_ worten. Es ist bequemer, mit den Logarithmen der Zahlen A und B und den 


Größen 


, = ige a). =1,2,...) (17.2.2) 
i f (2, %) 
zu operieren, als mit den entsprechenden Zahlen selbst. 

Das Prüfverfahren des betrachteten sequentiellen Quotiententests kann man 
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dann folgendermaßen beschreiben: Ist das m-te Element (m > 1) in die Stich- 
probe gewählt worden, so lehnen wir im Fall 


m 
32: Z log A 
1 
die Hypothese H, zugunsten ihrer Alternative HZ, ab, während wir dann, wenn 
m 
32: < log B 
i=1 
gilt, die Hypothese HZ, annehmen. Sind dagegen die Ungleichungen 
E 
log B< %z; <log A 
i=1 


erfüllt, so untersuchen wir das (m + 1)-te Element. 

Die Lösung der oben formulierten vier Probleme, die mit dem sequentiellen 
Quotiententest zusammenhängen, ergibt sich aus der Lösung derselben Probleme 
für ein allgemeineres Sequentialmodell, und zwar werden wir annehmen, daß 
die Zufallsvariablen z; gewisse allgemeine Eigenschaften aufweisen, doch werden 
wir nicht voraussetzen, daß sie von der Form (17.2.2) sind. 


17.3. Hilfssätze 


A. Wir betrachten nun die Folge {2,} von unabhängigen Zufallsvariablen mit der- 
selben Verteilung und endlicher Dispersion. Wir bezeichnen mit 2 eine Zufalls- 
variable, die dieselbe Verteilung wie die 2; hat, und mit Z,, die Summe der ersten m 
Glieder der Folge {z;}: 


. Zn = 2] +2+'-+ Zm- i (17.3.1) 


Ähnlich wie in 17.2 führen wir die Zahlen A und B ein, die die Ungleichungen 
0<B<i<A erfüllen. Dann gilt 


lgB=b<P0, lgA=a>0. 


Mit n sei die kleinste natürliche Zahl bezeichnet, für die Z, außerhalb des offenen 
Intervalls (b, a) liegt, für die also entweder Z,<b oder Z, > « ist. 
Bestehen für jedes m (m = 1, 2,...) die Ungleichungen 5 < Z, <a, so sagen 
wir, daß n = oo ist. : 
Satz 17.3.1. Wenn die Dispersion der Zufallsvariablen z von Null verschieden 
ist, so ist die Wahrscheinlichkeit dafür, daß n = © ist, gleich Null. 
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Beweis. Essei c=a—b. Wir teilen die unendliche Folge 2,, 2,, ... in Ab- 
schnitte 8, zu r Gliedern ein, wobei r eine natürliche Zahl ist. 

Der erste Abschnitt S, besteht aus den Gliedern 2,, 2, ..., 2, der zweite Ab- 
schnitt 8, aus den Gliedern 2,44, 2+3 -.., 2gr usw. Allgemein besteht der k-te 
Absehnitt 8, aus den Gliedern 2,_1yr+41» 2 —1yr+23 +++ Zer- 

Mit £, wollen wir die Summe der Glieder des k-ten Abschnitts bezeichnen: 

kr 
= 3 2. 
i=(k-1)r+1 


Es sei n = oo. Dann ist für jedes natürliche % die Ungleichung 


2<e . (17.3.2) 
erfüllt. 
In der Tat sind für jedes m nach Voraussetzung die Ungleichungen 


m 
b< 3) <a 
. i=1 


erfüllt. Für beliebige k und r bestehen also die Ungleichungen 


kr 
b< N <a. 


i=1 
Daraus folgt 
(E-1)r kr (k-1)r 
b—- Vs <u= 3 z<a<) 2. 
1 i=(k-)r+1 i=1 
Wenn wir noch 
(k-1)r 
b<)) <a 
i=1 
berücksichtigen, erhalten wir 
—c=b—-a<i,<a—db=e, (17.3.3) 


und hieraus folgt (17.3.2). 

Um zu zeigen, daß die Wahrscheinlichkeit dafür, daß bei einem sequentiellen 
Quotiententest nur endlich viele Beobachtungen erforderlich sind, gleich 1 ist, 
genügt es, für ein geeignetes r zu zeigen, daß die Wahrscheinlichkeit dafür, daß 
die Ungleichung (17.3.2) für jedes % gilt, gleich 0 ist. 

Wir setzen 


Tr =P(& < e). 
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Da die Zufallsvariablen 2; ( =1,2,...) unabhängig sind und dieselbe Ver- 
teilung haben, sind die Zufallsvariablen £; (k=1,2,...) gleichfalls unabhängig 
und gleichverteilt. Daraus folgt erstens, daß die Werte , für alle k dieselben sind 
(wir können also diese Wahrscheinlichkeit einfach mit r bezeichnen), und zweitens, 
daß die Wahrscheinlichkeit des Ereignisses, das daraus besteht, daß die Unglei- 
chung (17.3.2) für k=1,2,...,7 gilt, gleich x’ ist. 

“Um den Beweis zu beenden, genügt es zu zeigen, daß z <1 ist. 

Nach Voraussetzung ist die Dispersion D?(z) von 0 verschieden. Wenn wir die 

Unabhängigkeit der Zufallsvariablen z; berücksichtigen, erhalten wir 


Er 2 
EG)=E ( 2 .) | = r[B(2)] + r(r — VIE] = r[D2@) + r(E@)]. 


i=(k-1)r+1 
Wählen wir also die Anzahl r der Glieder eines Abschnitts hinreichend groß, 


so wird auch Z (22) beliebig groß; dann ist m < 1 (siehe Aufgabe 17.11.1). 
Aus dem bewiesenen Satz 17.3.1 folgt somit: Besitzt die Zufallsvariable 


2 Q:) 


=  ) 


eine endliche Varianz, so ist die Wahrscheinlichkeit dafür, daß das oben be- 
schriebene: Vorgehen beim sequentiellen Quotiententest zu einer Entscheidung 
für eine endliche Stichprobe führt, gleich 1. 

Wir haben also die erste der vier Fragen beantwortet, die in 17.2 gestellt 
wurden. 


B. Wir wollen jetzt gewisse zusätzliche Voraussetzungen über die Verteilung der 
Zufallsvariablen 2 machen und einen Satz beweisen, der für die weitere Dar- 
legung der Sequentialanalyse wichtig ist. 

Satz 17.3.2. Es sei 2 eine Zujallsvariable, die die folgenden Bedingungen erfüllt: 


1. Die Dispersion D®(z) existiert und ist von Null verschieden; es existiert also 
auch der Mittelwert E (2). 


‘2. Es existiert eine positive Zahl ö derart, daß die Ungleichungen 
P(z<log(1—8)>0, P(z>1log(1 +8) >0 (17.3.4) 


erfüllt sind. 

3. Für jede reelle Zahl h existiert der Mittelwert E(e”) = g(h). 

4. Es existieren die ersten beiden Ableitungen der Funktion g(h), und man kann 
sie durch Differentiation unter dem Zeichen E erhalten; darunter. versiehen wir 
eine Differentiation unter dem Integrationszeichen, wenn z eine stetige Zufalls- 
variable ist, und eine Differentiation unter dem Summalionszeichen, wenn 2 
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eine diskrete Zufallsvariable ist. Dann gült also 
g’(h) = Elze”), (17.3.5) 
g’(h) = E(z?e®). (17.3.6) 


Die Behauptung des Satzes lautet: Wenn E(z) #0 ist, gibt es einen. einzigen 
reellen Wert hun=0, der die Gleichung 


E(ew) =1 (17.3.7) 


erfüllt. Istdagegen E(2) =0, soerfülli nur der Wert h, = die Gleichung (17.3.7). 


Beweis. Es sei A >0 eine beliebige positive Zahl. Wir betrachten die Zufalls- 
variable y = e*. Diese Zuial:isariable kann nur positive Werte annehmen, das- 
selbe gilt auch für die Zufallsvariable y*. Nach Satz 3.3.1 erhalten wir daraus 


sh) =-E)<ZSU+N PVP) - IN Pezi+d). 
(17.3.8) 
Aus Bedingung 2 folgt P(® =1 +6)> 0. Wenn wir also die Beziehung 


lim (1 + 6)? = 


h>o 


beachten, so erhalten wir aus (17.3.8) 


lim g(k) = ®. (17.3.9) 


h—>o0 

Ähnlich können wir zeigen, daß für ein beliebiges A <0 die Beziehung 
sh>2(1-SPPleesi-9) 

besteht. Aus Bedingung 2 und 


lim (1 — ö)? = oo 
h>-% 


ergibt sich 
lim g(h) =. : (17.3.10) 


h>-co 


Weiter betrachten wir die zweite. Ableitung der Funktion g(k), die im Sinne 
von Bedingung 4 durch die Formel (17.3.6) bestiiamt ist. Wenn wir in dieser 
Formel die Bedingung 2 beachten, erhalten wir 


g’(h)>0. (17.3.11) 


Die Formeln (17.3.9) bis (17.3.11) zeigen, daß nur ein einziger reeller Wert h* 
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existiert, für den die Funktion g(k) ihr Minimum annimmt; dieser ist durch 
g’(h*)—=0 bestimmt. Wenn E(z) #0 ist, dann ist g9(0)=E(z) +0, also 
4*=0 undg(h*) <g(0) =1. 

Wie wir ferner erkennen, ist die Funktion g (A) im Intervall (— oo, h*) streng 
monoton abnehmend, während sie im Intervall (h*, co) streng monoton wach- 
send ist. Da g(0) =1 und g(h*) <1 ist, existiert also nur ein einziger Wert 
hu = 0 derart, daß g(h,) = E(e"*) = 1. Ist dagegen E(ez) =g’(0) =0 und sind 
alle übrigen Bedingungen 1 bis 4 erfüllt, so erkennt man leicht aus dem Beweis- 
verlauf, daß für diesen Fall A = 0 dereinzigereelle Wert ist, für den g(k) =1 ist. 
Der Satz 17.3.2 ist damit bewiesen. 


17.4. Eine grundlegende Identität 


Wir wollen jetzt eine grundlegende Identität beweisen, die eine große Rolle in 
der Sequentialanalyse spielt. 

Es sei {2,} eine Folge von unabhängigen Zufallsvariablen, die dieselbe Verteilung 
wie die Zufallsvariable z haben. Mit Z,, sei die Summe der ersten m Glieder der Folge 
{2;} bezeichnet. Wenn die Zufallsvariable z die Bedingungen 1 bis 4 aus 17.3 erfüllt, 
so gilt für jeden Punkt h aus dem Gebiet D, das durch die Ungleichung 


g(h) = Ele") 1 (17.4.1) 
charakterisiert wird, die Identität 
Eler(ga)}=1. (17.4.2) 


Dabei ist n wie in 17.3.A definiert. 
Beweis. Wir betrachten die Gleichung 
BE (er HZw-Zuh) a E(eZt) = E (eatar tm) ar (s(R))”, (17.4.3). 
x 
wobei N eine natürliche Zahl und » die kleinste natürliche Zahl ist, für die Z, 
außerhalb des offenen Intervalls (b, a) liegt. 

Wir bezeichnen mit P, die Wahrscheinlichkeit dafür, dd „n=<N ist. Mit 
Ey(w) wollen wir den bedingten Mittelwert der Zufallsvariablen « unter der Be- 
dingung » < N und mit E% (u) den bedingten Mittelwert der Zufallsvariablen « 
unter der Bedingung n > N bezeichnen. 

Wenn wir diese Bezeichnungen benutzen, können wir (17.4.3) in der folgenden 
Form schreiben: 


Pi Ey (ehren 200) 4 (1 — Pr) Ei (et) = (g(h)}?. (17.4.4) 


Da für jedes feste n< N der Ausdruck Zy — Zu = &nrı F Znrg + "+ 2y vom 
Wert 2, =2, 423 ++ 2, unabhängig ist, können wir schreiben: 


Ex (eIrk+(Zu—Zu)h) — Ey(efrk e(dn-Zmh) — Ey {et (g (Ayyr="} . (17.4.5 
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Aus den Formeln (17.4.4) und (17.4.5) erhalten wir die Identität in der Form 


Py En {e?"h (sa) "} + (1 — Pr) Erler) = (9 (AyF. 
Nach Division beider Seiten durch (g(A))” ergibt sich 


E* Zuh 
a =, (17.4.6) 


Ist nun die durch Formel (17.3.7) bestimmte Zahl Rh, negativ, so besteht das 
Gebiet D, das durch Formel (17.4.1) bestimmt ist, aus der ganzen reellen h-Achse 
mit Ausnahme des offenen Intervalls (R,, 0). Ist dagegen h, > 0, so besteht D 
aus der h-Achse ohne das offene Intervall (0, },). 

Da im Pr <N)=1 sit, ist im(1 — Py)=0. . 

N-—>00 No 

Wir behaupten, daß E%(e?®*) für N — oo beschränkt ist. In der Tat ist dieser 
Ausdruck der Mittelwert von e?”* unter der Bedingung, daß n > N, also b < Zy 
<a ist. Es ist somit für h > 0 


Pr Byfeät (ga) +1 Pr) 


eh ednh < ech 
und für a<0 
ech < eZxh < ebh. 
Daraus folgt, daß E}(e?®*) eine beschränkte Funktion ist. 
Berücksichtigen wir schließlich noch, daß nur das Gebiet D derjenigen Werte h 


betrachtet wird, für welche g(h) > 1 ist, so erhalten wir 


1 — Pr)Bile) _ 


17.4.7 
[op u 
und ' 
lim Py Eyfeh[g(h)]-") = Ele [g(h)]"). (17.4.8) 
No 


Wenn wir (17.4.7) und (17.4.8) benutzen, so erhalten wir aus (17.4.6) die Formel 
(17.4.2). 

Brom [1] bewies die Waldsche Grundidentität unter schwächeren Voraus- 
setzungen, als wir sie angegeben haben, und verallgemeinerte darüber hinaus diese 
Identität für den Fall, daß die Zufallsvariablen 2, nicht die gleiche Verteilung 
haben. BLACKwELL und Girstick [1] verallgemeinerten die Grundidentität auf 
Zufallsvektoren. i 
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17.5. Die Operationscharakteristik des sequentiellen Quotiententests 


A. Die Operationscharakteristik des sequentiellen Quotiententests wollen wir 
hier kurz mit L(Q) bezeichnen. Wir betrachten die Folge {2;} der unabhängigen 
Zu£allsvariablen, die durch die Formel (17.2.2) bestimmt sind und den Bedingun- 
gen 1 bis 4 aus Satz 17.3.2 genügen. Die Zufallsvariable z sei durch 


Hin,Q) 
f(&, &o) 


definiert. Wir setzen voraus, daß z die Bedingungen 1 bis 4 aus 17.3 erfüllt. Nach 
Satz 17.3.2 existiert für den Fall, daß E(z) +0 gilt, ein einziger Wert ,= 0, 
der der Bedingung (17.3.7) genügt; ist dagegen E(z) — 0, so ist diese Bedingung 
nur für A, —=0 erfüllt. 

Wir wollen uns vorläufig auf den Fall E(z) #0 beschränken. Da die Ver- 
teilung der Zufallsvariablen z von Q abhängig ist, hängt auch der Wert A, der 
durch die Formel (17.3.7) bestimmt ist, von Q ab. Wir schreiben A, = h,(9); aus 
(17.3.7) wird also 


z = log 


g9(hu(Q)) = Ele" 9] = 1. (17.5.1) 


Ist x eine stetige Zufallsvariable mit der Dichte f(x, Q), so können wir diese 
Gleichung in der Gestalt 


oo 


hu(Q) 
g(hıQ)) = [ N) f@,Q)de =1 (17.5.2) 
»%0 


schreiben. 
Ist dagegen x eine diskrete Zufallsvariable, so nimmt die Gleichung (17.5.1) 
die Form 


+ (Fa 9)\® 
HA) =L% oo I; Q)=-1 (17.5.3) 
ra) 
an, wobei 2,5 =1,2,...) die Sprungstellen der Zufallsvariablen x sind, während 
mit f(x,, Q) in Übereinstimmung mit der in diesem Kapitel eingeführten Schreib- 
weise die vom Parameter Q abhängige Wahrscheinlichkeit von x = x, bezeichnet 
ist. 
Wir wollen jetzt die Identität (17.4.2) für den Wert k =h, aufschreiben. 
Da g(h,) = 1 ist, können wir diese Identität in der Form 


Eglerktd) — 1 (17.5.4) 


schreiben. Der Index Q soll darauf hinweisen, daß die linke Seite der Formel 
(17.5.4) eine Funktion des Parameters @ ist. 
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Ferner bezeichnen wir mit E7 den bedingten Mittelwert der Zufallsvariablen 
e?rh@) unter der Bedingung, daß die Hypothese H,(Q =Q,) angenommen wurde 
(d.h., daß Z,<log B); analog bezeichnen wir mit E‘* den bedingten Mittel- 
wert der Zufallsvariablen e?"%*«® unter der Bedingung, daß die Hypothese 
H,(@=@Q,) angenommen wurde (d.h., daß Z, > log A). Unter Beachtung der 
Bedeutung des Symbols L(@) ergibt sich aus (17.5.4) die Formel 


L(QRE + (1 — LQ)ES = 1 


und daraus 
Er —1 
Lio) = —ı—. 17.5.5 
VS (17.5.5) 
B. Wir wollen eine Näherungsformel für L(Q) finden. Zu diesem Zweck betrach- 
ten wir statt der Ungleichungen Z,=<logB und Z,>1logA die Gleichungen 
Za=logB und Z, =log A. Setzen wirin den Ausdruck eZr!«® die Gleichung 
Zu =logB ein, so erhalten wir 


Es (eZrı9) SI Bi:@) 5 


da wir bei Z, =-log.B die Hypothese HZ, annehmen. Ähnlich ergibt sich, wenn 
man Z, =log A einsetzt, die Näherungsformel 


E;* (erh) wu Aa), 


Wenn wir diese Ausdrücke in (17.5.5) einsetzen, erhalten wir eine Näherungs- 
formel für die Operationscharakteristik des sequentiellen Quotiententests: 


Ad) —_1 
L(@) o Au) _ Bi)" 


(17.5.6) 

Die Formel (17.5.6) wurde unter der Bedingung E(z) + 0, also für h,(@) # 0, 

hergeleitet. Wenn E(z) =0 ist, dann ist auch A,(Q’) = 0, wobei Q’ der Wert 

des Parameters Q ist, für den E(e) =0 ist; die rechte Seite des Ausdrucks 

(17.5.6) hat dann im Punkt Q’ den Grenzwert lim Z(Q) = L(@'), der gleich dem 
a 


Quotienten der Ableitungen des Nenners und Bes Zählers nach Q im Punkt 9’ 
ist. Wir erhalten also, wenn wir die Existenz der Ableitung von R,(Q) im Punkt Q'’ 
voraussetzen, 

log A 


L(Q') 8 —————. 
log A — log B 


(17.5.7) 

Die Formel (17.5.2), eventuell auch (17.5.3), erlaubt es, @ als Funktion von A, 
zu bestimmen, während (17.5.6) den Wert von L(Q) zu bestimmen erlaubt, 
wenn h,(Q) bekannt ist. Hieraus kann man für einen beliebigen reellen Wert 


688 17. Elemente der Sequentialanalyse 


von h, Punkte der Ebene mit den Koordinaten Q, L(Q) bestimmen. Die Kurve, 
die diese Punkte miteinander verbindet, ist eine angenäherte Darstellung der 
Operationscharakteristik. 

Wir wollen uns überlegen, welcher Art die Näherung ist, die wir bei der Her- 
leitung der Formeln (17.5.6) und (17.5.7) für die Operationscharakteristik an- 
wandten. 

Wenn wir Z, =log4 und Z,=log B setzen, vernachlässigen wir die Mög- 
lichkeit, daß die Ungleichungen Z,>log 4 oder Z,>logB im Augenblick 
der Beendigung des sequentiellen Verfahrens gelten können. Mit anderen Worten, 
wir schreiben Z, =logB, obwohl in Wirklichkeit Z,<logB ist, bzw. Z, 
=log A, obwohl in Wirklichkeit Z, > log A ist. 

Kann z nur die zwei Werte d und —d annehmen, so kann Z, nur N Kd 


log A 
sein, wobei X eine ganze Zahl, negativ oder positiv ist. Wenn zugleich = 


und es ganze Zahlen sind, so kann die Entscheidung über die Annahme 
der Hypothese nur bei Z, =logB oder Z, =1log A fallen. In diesem Fall sind 
die Formeln (17.5.6) und (17.5.7) für L(Q) vollkommen exakt. Erstreckt sich der 
Wertebereich der Zufallsvariablen z nicht nur auf die obenerwähnten Werte —d 
und d, sind aber |Eo(2)| und D%(z) nicht groß, so erweisen sich in der Praxis 
die Näherungsformeln für L(Q) als gut. 

Die Voraussetzung, daß Z, im Augenblick der Entscheidung die Werte log A 
oder log B nicht übersteigt, wird häufig bei der Anwendung des sequentiellen 
Quotiententests gemacht. 


17.6. _ Der Mittelwert E(n) 


A. Wie schon in 17.1 gesagt wurde, charakterisiert die mittlere Anzahl der Beob- 
achtungen E(n) einen Sequentialtest. Für den sequentiellen Quotiententest, der 
zur Nachprüfung der Hypothese H,(Q =Q,) im Vergleich mit der Alternativ- 
hypothese H,(Q = Q,) dient, wollen wir die Größe E(n) als Funktion des un- 
bekannten Parameters Q finden. Dazu benutzen wir die grundlegende Identität 
(17.4.2). 

Wir nehmen zuerst E() +0 an. Wie Warn [3] zeigte, kann man, wenn 
die Bedingungen 1 bis 4 aus 17.3 erfüllt sind, die Identität beliebig oft unter 
dem Zeichen E nach A differenzieren. Wir differenzieren also (17.4.2) nach h 
im Punkt  =0 und erhalten 


BolZueh[g(h)]* — nerh[g(h)] rg (h)u-n = 0. (17.6.1) 


Der untere Index @ soll wie vorher zeigen, daß dieser Mittelwert von Q abhängt. 
Da g9(0)=1 und g’(0) = Ei) gilt, ergibt sich 


Ea [Zu = nEg (2)] Zuge: 0, 
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und weil nach Voraussetzung Eo(z) #0 ist, erhalten wir 


Eg (Z,) 


N Bol) 


(17.6.2) 


Wir wollen jetzt E9(Z,) bestimmen. Mit E53 (Z,) bezeichnen wir den bedingten 
Mittelwert der Zufallsvariablen Z, unter der Bedingung Z, <logB und mit 
Ei” (Z.) den bedingten Mittelwert der Zufallsvariablen Z, unter der Bedingung 
Zn = log A. Wir erhalten 


Bg(Z.) = L(Q)BS(Z,) + 1 — LIES (Zu). (17.6.3) 
Die Formel (17.6.2) nimmt dann folgende Gestalt an: 


L(Q) ES (Z,) + [1 — L(Q)1ES* (Zu) 
Eo(@) 


Ex(n) = (17.6.4) 


Wenn man die Differenzen log B— Z, und Z, — log A vernachlässigen kann, 
wenn man also annehmen kann, daß die Entscheidung bei Z, =logB oder 
Zn = log 4 fällt, so kann man für EZ, (Z,) die Größe log B und für E53” (Z,) die 


“ Größe log A einsetzen. Die Formel für die mittlere Beobachtungsanzahl erhält 


also die Gestalt 
| L(Q) log B + It — L(Qllog A 


Eo(n) E.e) 


(17.6.5) 


Diese Formel ist exakt, wenn 2 nur die zwei Werte —d und d annehmen kann, 
von denen in 17.5 die Rede war. Beschränkt sich der Wertebereich der Zufalls- 
variablen z nicht auf diese beiden Werte, sind aber |E, (2) | und D?(z) nicht groß, 
so kann man, wie schon erwähnt, den Überschuß von Z, über die Werte log A und 
log B außer acht lassen. Die Formel (17.5.6) ergibt dann eine Annäherung für den 
Mittelwert E, (nr). 


B. Bisher setzten wir Ey(z) #0 voraus. Nun nehmen wir Ey (z) = 0 an. Nach 
zweimaligem Differenzieren der grundlegenden Identität nach A erhalten wir 


elle eat neu nl ie -]- N 
“R il 75 (sl er () 


(17.6.6) 


Betrachtet man die Ableitung im Punkt A =0 und berücksichtigt man, daß 
gr) =1,g(0) = Erle) =0 und g”’(0) = Er (ke) +0 ist, so erhält man aus 
(17.8.6) die Formel 


Ey (zZ, — nEy (22) =0 


44 Fisz 
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und schließlich 
Ey (22) 
Ey (22) 


Ey (n) = (17.6.7) 


Wir wollen jetzt E,(Z#) bestimmen. Mit ES(Z}) bzw. ES*(Z?) wollen wir 


die bedingten Mittelwerte der Zufallsvariablen Z2 unter der Bedingung Z, < log B 
bzw. Z, = log A bezeichnen. Wir haben dann 


EZ) = LEE ZU) + U - LONEFZI. (17.6.8) 


Wenn man die Differenzen log B — Z, und Z, — log A vernachlässigen kann, 
nehmen E%. (Z7) und EG" (Z7) die Werte (log .B)? bzw. .(log A)? an. 

Unter Beachtung der Formel (17.5.7) für L(@’) im Fall, daß Ey.) = ist, 
ergibt sich 


log A log A 
Eu: (Z2) # — ———— (log B)? 1 —- ————— | (log 4)? 
a ae +| Frei ı 
= —logAlogB. (17.6.9) 
Aus deu Formeln (17.6.7) und (17.6.9) folgt schließlich 
Erin) — Ber (17.6.10) 
Ea (2?) 


Die letzte Formel hat unabhängig von WALD auch WArtiS [1] hergeleitet. 

Wir weisen den Leser darauf hin, daß die Formeln (17.6.2), (17.6.4) sowie die 
Näherungsformeln (17.6.5) und (17.6.10) für alle Zufallsvariablen gelten, die die 
Voraussetzungen des Satzes 17.3.2 erfüllen, und daß sie somit nicht nur für die 
in (17.2.2) definierten 2, gelten, die im sequentiellen Quotiententest auftreten. 
BLACKWELL [1], BLACKWELL und GIRSHICK [1] sowie WoLFOWwITz [2] beschäftigten 
sich mit verschiedenen Verallgemeinerungen der Formel (17.6.2). In der zuletzt 
genannten Arbeit wird der Fall betrachtet, daß die Zufallsvariablen z; abhängig 
sind und nicht die gleiche Verteilung haben (siehe auch Aufgabe 17.11.2). 


17.7. Die Bestimmung der Zahlen A und B 


Es bleibt nur noch eine der vier Fragen, die im Zusammenhang mit dem sequen- 
tiellen Quotiententest gestellt wurden, zu beantworten, nämlich die folgende: 
Wie bestimmt man die Zahlen A und B als Funktionen der Wahrscheinlichkeiten 
& bzw. ß, mit welchen ein Fehler erster bzw. zweiter Art im sequentiellen Quotien- 
tentest gemacht werden kann? Wir wollen uns hier auf den Fall beschränken, 
daß man annehmen kann, die Entscheidung falle bei Z, = log B oder Z, = log A. 
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Vor allem beachten wir, daß aus den Formeln (17.5.2) und (17.5.3) die Gleichun- 
gen 


KA) AK)=— (17.7.1) 


folgen. Diese Ausdrücke setzen wir in (17.5.6) für L(@) ein. Unter Berücksichti- 
gung von L(Q,) =1— oo und L(Q,) = erhalten wir 


A—i 

L(Q,) & ee 1-a,- (17.7.2) 
1 

INGALS ti =ß. (17.7.2°) 
AB 


aa Beuel. (17.7.3) 


& 1—- x 


Yies sind selbstverständlich nur Näherungsformeln, die aber für praktische 
Zwecke meist ausreichen. | 


17.8. Die Nachprüfung einer Hypothese über den Wert des Parameters p in 
einer Null-Eins-Verteilung 


A. Wir befassen uns jetzt mit der Anwendung der hier dargelegten Theorie eines 
sequentiellen Quotiententests zur Nachprüfung einer Hypothese über den Wert 
des Parameters 9 in einer Null-Eins-Verteilung. 

Die Zufallsvariable x habe- eine Null-Eins-Verteilung, d.h., es sei Pix =) 


=p und Pa =0)=1—p(0<p<1), wobei p unbekannt sei. So bestehe 


z. B. eine Gesamtheit aus fehlerhaften und fehlerlosen Stücken. Dem Auslosen 
eines fehlerhaften Stücks ordnen wir die Zahl 1, dem Auslosen eines fehlerlosen 
die Zahl 0 zu. Gemäß der in diesem Abschnitt angenommenen Bezeichnungsweise 
ist 

tD)=pn OM=-1-—p. (17.8.1) 


Wir stellen die Hypothese H,(p = p,) auf und wollen sie gegen die Alternativ- 
hypothese H,(p = ?,) testen. Dabei sind 9, und 9, bestimmte Werte, für die 
0<Pm<P<TI ist. Die Wahrscheinlichkeit, einen Fehler erster bzw. zweiter 
Art zu machen, sei gleich & bzw. ß. 


44* 
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Wir wollen einen sequentiellen Quotiententest anwenden. Wiederum sei 


ee) | (17.8.2) 


I® Po) 


Die Zufallsvariable z kann zwei Werte annehmen, nämlich 2 =logp, — log p, 
für =1 und z2=log(1 — p)—-log(1 —- 9) für «=0. Zuerst wollen wir 
nachprüfen, ob die Zufallsvariable 2 die in 17.3 formulierten Bedingungen 1 bis 4 
erfüllt. 

Die Bedingung 1 ist erfüllt, da 2 eine endliche, von Null verschiedene Dis- 
persion hat. Tatsächlich berechnen wir 


x Far p un 1-p 
B=plg® +1 plogi— 2 —10g (2) (=) | 
2 1 — 9 


20] \1 — 9 
(17.8.3) 
wobei p der wirkliche Wert des unbekannten Parameters ist. Weiter ist 
2 io. 
Be) =p (1 2 +(d1-9) (18 2) 
Do 1m 
Nach einer Umformung erhalten wir 
= 2 
Dee) = pli—p) [18 | (17.8.4) 
Mil — 9) 


Da nach Voraussetzung P, # Pı und p, sowie p, verschieden von Null und 
Eins sind, ist D?(z) endlich und von Null verschieden. 
Wir gehen zur Bedingung 2 über. Es gilt 


e — &ı für z=1, (17.8.5) 
Po 
es 

e — Pı für 2=0. 
1-% 


Nach Voraussetzung ist p, > 2, also 1— 9 <1-— 2,. Wir setzen 


AR 
Pr gay, »de ae, 
Po 1-m 


= 5 min (64, ö,). 
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Die Zahl ö ist also kleiner als jede der beiden Zahlen ö, und d,. Es bestehen daher 
die Beziehungen 


Ple<i-H=Ple= —B)\=1-9>0, (17.8.6) 


Ple>1+5) e(e 2) p>0. 


Die Bedingung 2 ist also erfüllt. 
Ferner gilt für jedes reelle h 


h a h 
g(h)= Ele") =p (2) +(1-p} E ) 1 (17.8.7) 
Po 1-9 


Aus den Voraussetzungen über 9 folgt, daß die Funktion g(h) für jedes h existiert 
Die Bedingung 3 ist damit gleichfalls erfüllt. 


Weiter gilt 
h 1-o\R = 
g'(h) -,(2) log # + (1 ( 2) To Di ae), 
Po Po Ii-p) 1m 
(17.8.8) 
Ähnlich kann man zeigen, daß 
g’(h) = E(e?e") (17.8.9) 


ist. Folglich ist auch die Bedingung 4 erfüllt. 


B. Das sequentielle Verfahren hat hier folgenden Verlauf: Wir stellen uns vor, 
wir hätten schon m Beobachtungen angestellt. Dabei sei m,-mal der Wert &=1 
und (m — m,)-mal der Wert x =0 beobachtet worden. Dann ist 


Zn = my log Pi + (m — m,) log : =, (17.8.10) 
Po 


— Po 


Die Konstanten A und B bestimmen wir aus (17.7.3). 
Wir werden also die Hypothese Z, ablehnen, wenn 


m, log Pi} (m m.) log BD > log A (17.8.11) 
Do 1m 


ist, und die Hypothese H, annehmen, wenn 


1— 


Pı Pı < 108 B (17.8.12) 
=» 


m, log — + (m — m.) log 
Po 1 
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ist. Schließlich setzea wir die Untersuchung fort, wenn 


1-2 


< log A (17.8.13) 
1 Po 


log B < m, log Pı + (m — m,) log 
Po 


ist. Durch Umformung von (17.8.11) erhalten wir 


log Pi 
log A 1 —.9 , 
m = ; m i : (17.8.11) 
log Diez. log ZH log Pı log Pı 
Ps 1— Mm Po 1m 


log B x = 
m, < os : ee nt 2 (17.38.12) 
log Pı _ log oh log pı log Pı 
Po 1% {) 1-9 
log B oe = 
og n — Mm — Bo <m 
log BP _ log Pı log Pı _ log Pı 
Po j — Po Po -— Po 
. (17.8.13’) 
4 Jog Pı 
< 08 ? m — Bo : 
log Pı log Pı log Pı log Pı 
Po 1-9 Po 1-2» 


Die rechte Seite der Ungleichung (17.8.11’) wollen wir mit r,, bezeichnen und 
Ablehnungszahl nennen. Die linke Seite der Ungleichung (17.8.12’) wollen wir mit 
@,, bezeichnen; sie heiße Annahmezahl. 

Dies bedeutet: Ist in einer einfachen Stichprobe vom Umfang m die Anzahl 
der fehlerhaften Stücke nicht, kleiner als r„, so lehnen wir die Hypothese 
H,(p = P,) zugunsten ihrer Alternativhypothese H,(p=7,) ab; ist dagegen 
die Anzahl der fehlerhaften Stücke nicht größer als a, so nehmen wir die Hypo- 
these H,(p = p,) an. Wir setzen die Untersuchung fort, falls die Anzahl der 
fehlerhaften Stücke größer als a, und kleiner als r,, ist. 

Ehe wir an die Ausführung der sequentiellen Versuche schreiten, können wir 
für gegebene p,, ?,, & und f die Zahlen a, und r„ berechnen. 

Die Größen r„ und a, sind lineare Funktionen des Stichprobenumfangs m. Man 
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kann sie also in der Form 
„=cem+d, bzw u=cm-+d, 


schreiben. 

Leicht bestätigt man, daß für 9, > 9, die Ungleichungen c>0, d,>0 
und d,<0 bestehen. 

Der typische Verlauf dieser Funktionen in der m, m,-Ebene: ist in Abb. 17.8.1 
dargestellt, ohne daß die Parameterwerte c, d, und d, präzisiert wurden. Wie man 
aus dieser Zeichnung ersieht, entspricht das oberhalb der Geraden r„ gelegene 


Abb. 17.8.1 


Gebiet einschließlich der Geraden r„ den Testergebnissen (m, m,), für welche wir 
die Hypothese H, ablehnen (wir nennen deshalb dieses Gebiet Ablehnungsgebiet). 
Ähnlich nennen wir das unterhalb der Geraden a,, gelegene Gebiet mit Einschluß 
der Geraden a, das Annahmegebiet. 

Liegt ein Punkt (m, m,) zwischen den Geraden r, und a,„, so setzen wir die 
Probenentnahme fort. 

Wir wollen jetzt die Operationscharakteristik dieses Beispiels finden. Wenn 
wir diejenigen Werte von » auslassen, für die Z(z) =0 gilt, erhalten wir für die 
übrigen Werte von p wegen der Formel (17.5.3) 


holp) Er he(p) " 
p (2) +(d-p) (=) =; (17.8.14) 
Do 1m 


wobei A,(p) #0 ist. 
Aus dieser Gleichung läßt sich p als Funktion von h, bestimmen: 


en] 
m (17.8.15) 


A 
Po 1-9 


er 
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Weiter erhalten wir aus der Formel (17.5.6) für L(p), wenn wir die Werte A und B 
nach den Formeln (17.7.3) bestimmen, 


9 


Lip) = ———  —, 17.38.16 

(P) T_ Am ; m | ( ) 
& 1—-& 

Die Formeln (17,8.15) und (17.8.16) stellen eine Parametergleichung der Kurve 

L(p), also der Operationscharakteristik dar. 

Die mittlere Beobachtungsanzahl EZ (r) berechnet man aus (17.6.5), indem man 
(17.38.15), (17.83.16), die Formel (17.7.3) für die Konstanten A und B und die 
Formel (17.8.3) für #£(z) benutzt. 

Der Leser findet leicht den Wert von L(p) für den Wert p, für welchen E(z) = 0 
ist, und die mittlere Beobachtungsanzahl für diesen Wert p. 


Wir wollen für das hier betrachtete Problem die folgenden Zahlenwerte an- 
nehmen: 


»=005, M=0l, «=ß= 0,08; 


p sei der unbekannte Ausschußanteil in einer Gesamtheit, die fehlerhafte und 
fehlerlose Stücke enthält. Wir erhalten hier 


log A = log 


1 PB 10819 — 1,27875, 
& 


log B=ko = — log19 = — 1,27875. 
8 g g 


1—« 
Die Zufallsvariable z, die durch (17.8.2) definiert ist, kann zwei Werte annehmen, 
nämlich den Wert z = log2 = 0,30103 für den Fall x=1 (d.h. für den Fall, 


daß in der Stichprobe ein fehlerhaftes Stück vorkommt) und 2 =log I 


= — 0,02348 für x = 0 (wenn ein fehlerloses Stück ausgelost wurde). Der sequen- 
tielle Quotiententest besteht hier darin, daß wir die Hypothese H,(p = 0,05) 
zugunsten der Hypothese H,(p = 0,1) ablehnen, wenn es sich nach dem Auslosen 
des m-ten Stückes (m = 1,2,...) zeigt, daß sich in dieser Stichprobe m, fehler- 
hafte und m — m, fehlerlose Stücke befinden, wobei unter Berücksichtigung 
der Formel (17.8.11) für Z,, die Ungleichung 


0,30103 m, — 0,02348 (m — m,) > 1,27875 


erfüllt ist. 
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Ist dagegen 
0,30103 m, — 0,02348 (m — m,)S — 1,27875, 


so nehmen wir die Hypothese Z,(p = 0,05) an, und bestehen schließlich die 
Ungleichungen 


| —1,27875 < 0,30103 m, — 0,02348 (m — m,) < 1,27875, 


so setzen wir die Untersuchung fort, d. h., wir wählen ein weiteres (m + 1)-tes 
Stück in die Stichprobe. 

Die Ablehnungszahlen r,, der Hypothese H,, die durch die rechte Seite der Un- 
gleichung (17.8.11’) bestimmt sind, nehmen hier die Gestalt 


I = ne m wu = 3,94 + 0,072 m 
0,30103 + 0,02348 0,30103 + 0,02348 | 


an. Ähnlich finden wir 


127875 0.0234 
An men ee ren — 3,94 0,072 m. 
0,30103 — 0,02348 0,30103 -- 0,02348 


Die Operationscharakteristik dieses Tests können wir aus den Formeln (17.8.15) 
und (17.8.16) -bestimmen. Sie ist durch die folgenden Parametergleichungen 
gegeben: 


Wie bekannt, ist nach (17.7.2) und (17.7.2’) 
L(0,05) = 0,95, _LZ(0,10) = 0,05. 


Wir berechnen noch die mittlere Beobachtungsanzahl, wenn die Hypothese 
H,(p = 0,05) bzw. die Hypothese 7, (p = 0,1) a ist. Aus Formel (17.6.5) 
erhalten wir 


L(0,05)(—1,27875) + [1 — "LiObsyHLETRTS 


E,,05(") az Ele) 
0,05 


aus (17.8.3) ergibt sich 


; 18\9,95 
Eo,05(2) = log 20% + log (1) —= —0,00725.° 
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Schließlich erhalten wir 
En,0s(n) 3 159. 

Auf ähnliche Weise ergibt sich 
Ey, (rn) 128. 


Es könnte scheinen, daß die hier erhaltenen mittleren Beobachtungsanzahlen 
sehr groß sind. Wir zeigen jedoch, daß die Anwendung eines Sequentialtests sich 
günstiger als die Anwendung eines klassischen Tests auswirkt, der nach der 
Methode von NEYMAN-PEARSON (Kap. 16) gebildet wird. 

Zu diesem Zweck wollen wir die betrachtete Hypothese. A,(p = 0,05) gegen 
die Alternative A,(p = 0,1) testen, und zwar durch die Anwendung der klassi- 
schen Methode für 


n = 


5 [Eo.os(r) + Eon) rw 144. 

Dabei wird weiter angenommen, daß «x = 0,05 ist. Zunächst wollen wir einen 
Untersuchungsplan aufstellen. Wir müssen also eine Zahl k finden, so daß wir die 
Hypothese H,(p = p, = 0,05) ablehnen, wenn die Anzahl der Ausschußstücke 
größer als k ist; dabei soll die Wahrscheinlichkeit, einen Fehler erster Art zu 
machen, nicht größer als 0,05 sein. Diese Zahl k können wir aus der Relation 


12 /144 : F 
>2 | ‚ 0,05 . 0,9517 < 0,05 
j=ek+ı1\ 


bestimmen. Da r groß ist, benutzen wir zur Bestimmung von % die Poissonsche 
Verteilung mit dem Mittelwert np, = 7,2 (siehe 5.5). Wir erhalten k = 12. 

Jetzt berechnen wir die Wahrscheinlichkeit 8 für einen Fehler zweiter Art. 
Wir setzen also voraus, daß p = ?pı = 0,1 ist, und berechnen den Wert 


u 144 
p=1-N ee 0,19.0,9143, 
j 


j=13 


Diese Größe finden wir aus der Poissonschen Verteilung mit dem Mittelwert 
np, = 14,4. Wirerhalten hier 8 = 0,3203. Die Wahrscheinlichkeit für einen Fehler 
zweiter Art ist hier also mehr als sechsmal so groß wie bei Anwendungen eines 
sequentiellen Quotiententestes mit ungefähr derselben durchschnittlichen Beob- 
achtungsanzahl. 

Um die Frage nach den Vorteilen vollständig zu beantworten, die wir für dieses 
Problem durch Anwendung eines sequentiellen Quotiententests statt einer 
klassischen Methode mit konstantem Stichprobenumfang erreichen, berechnen 
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wir den Wert n, der bei Anwendung der klassischen Methode auf das betrachtete 
Zahlenbeispiel nötig ist, um x und # nahe an 0,05 zu erreichen. 

Da n hier bestimmt ziemlich groß sein wird (größer als 144), können wir den 
Moivre-Laplaceschen Grenzwertsatz benutzen. Wir bezeichnen mit y die Anzahl 
der Ausschußstücke in einer Stichprobe vom Umfang n. Diese Zufallsvariable 


ist asymptotisch normal N (0,05 n; 0,0475.) verteilt, wenn die Hypothese 
H,(p = 0,05) erfüllt ist, und asymptotisch normal N (0,1 n; y0,09 n) verteilt, 
wenn die Hypothese H,(p = 0,1) erfüllt ist. 

Um diese Hypothesen zu testen, wählen wir als kritische Region w die Menge 
der Punkte & im Stichprobenraum, für welche die Gleichung 


P(> 4A) = 0,05 


0,0475 
N 


verteilt ist. Die unbe- 


erfüllt ist, wobei nz 7 normal N (005: |/ 
N 


kannten Werte A und n bestimmen wir aus dem System der. zwei Gleichungen, 
die sich daraus ergeben, daß & = f = 0,05 ist: 


„ln 
(4 - 0,05) = 1,65, er 
0,0475 y0,09 


Aus diesem Gleichungssystem erhalten wir n x 292, A x» 0,071. 

Da A der kritische Wert von % ist, beträgt der kritische Wert von y dann 
An = 20,7» 21; wir lehnen also die Hypothese H,(p = 0,05) zugunsten der 
Hypothese H,(p = 0,1) ab, wenn wir in einer einfachen, 292 Stücke zählenden 
Stichprobe 21 oder mehr Ausschußstücke vorfinden. Die Wahrscheinlichkeit 
für einen Fehler erster Art wie auch die Wahrscheinlichkeit für einen Fehler zweiter 
Art werden wegen der diskreten Verteilung von y und der benutzten normalen 
Annäherung ungefähr gleich 0,05 sein. 

Wir kommen also zu dem Schluß, daß man eine Stichprobe mit n = 292 Ele- 
menten erheben muß, um einen gleichguten Test zu erhalten, also beinahe zweimal 
soviel, wie der durchschnittliche Stichprobenumfang bei Anwendung eines se- 
quentiellen Quotiententests beträgt. Die Anwendung von Sequentialtests ist 
also zweifellos vorteilhafter. 


17.9. Die Nachprüfung einer Hypothese über den Mittelwert Q 
einer Normalverteilung 


Es sei x normal _N(Q;1) verteilt, wobei @ den unbekannten Mittel- 
wert bedeutet. Wir stellen die Hypothese HA, (@ = Q,) und die Alter- 
nativhypothese HZ, (Q@ =Q,) auf, wobei Q,>Q, ist. Mit den bisherigen 
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Bezeichnungen ist 


1 -@-Q° : i 
a (17.9.1) 


f&, do) = in 
fa; 0) = es ae, (17.9.2) 
Y2= 
" &, Qı) Bu Be fe 
2 = log 0) 2 [a — 90)? — (2 — Q)?] 
= (Q, — Qo)8 4 > (0 a): | (17.9.3) 


Wie der Leser mit Leichtigkeit nachprüft, erfüllt die Zufallsvariable 2 die 
in 17.3 formulierten Bedingungen 1 bis 4. Wir erhalten 


ES R-M, (17.9.4) 
i=1 i=1 


wobei die x; # =1,2,..., m) unabhängige Beobachtungen der Zufallsvariablen 
x sind. 

Wir bestimmen nun die Operationscharakteristik dieses Tests. Aus der Formel 
(17.5.2) erhalten wir 


(* — Qye Jr) 
if (x — 2 or (- 2 ) 
oe ie ze BE BE ur 


= (- € e 


(17.9.5) 
Nach Umformung ergibt sich 


— u 


2 nn de =1. (17.9.6) 
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Den Exponenten im letzten Integral schreiben wir in der Form 
1 n 5 
2 {x = (@ + Asa) (Qı - “n)}: 


— —hu(@) Or — Q) (Qı + 9 20 — hul0) (Qı — Mn). 


2 


eu ic | ( _ (Q +%9) (@ı zu del (17.9.7) 


ist, muß die Gleichung 


9 +20 
h = mn 17.9.8 
u er (17.9.8) 


gelten, damit (17.9.6) erfüllt ist. Daraus folgt, daß das durch Formel (17.9.8) 
bestimmte k,(@) eine Lösung der Gleichung (17.9.5) ist. Da die Zufallsvariable 
2 die Bedingungen 1 bis 4 aus 17.3 erfüllt, gibt es für jeden Wert von Q nur einen 
einzigen Wert h,(Q),. der (17.9.5) erfüllt. Daher ist das durch (17.9.8) gegebene 
h,(Q) die einzige Lösung. 

Die Operationscharakteristik erhalten wir aus (17.5.6) und (17.9.8). Somit ist 


( = Ju ; 
z (17.9.9) 


1 — p\r® B \me' 
(=) 


Diese Formel gilt für alle Werte Q mit %,(@) = 
Leicht erkennt man, daß Ah,(Q) = 0 für 


LQ)= 


I} 
= 


oe, 
a, 


ist. Also besteht nach Formel (17.5.7) für diesen Wert Q’ die Gleichung 


L(QN = < (17.9.10) 
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Wir berechnen jetzt- die mittlere Beobachtungsanzahl Eo(n) als Funktion 
des Parameters Q. 
Für 9 #0’ haben wir nach Formel (17.6.5) 


L@logB + U —- L@lleed 


cz Eo() 


(17.9.11) 


Die Operationscharakteristik L(Q) ist durch (17.9.9) gegeben. Wir müssen 
noch Eg(z) bestimmen. Aus (17.9.3) ergibt sich unter Berücksichtigung der Be- 
ziehung E(x) = @ die Gleichung 


Ba) = A -WO+ ZUM. (17.9.12) 


Im Punkt 9’ gilt die Beziehung Ey(2) =0; man kann also hier die Formel 
(17.9.11) nicht anwenden. Die durchschnittliche Beobaehtungsanzahl finden 
wir für diesen Fall aus 


= 
log ie, log u 
& 1—-a 


Ey (n) Be) N | (17.9.13) 


Es gilt 


1 ı 
Bid) =, ji 20 a + HT 


oxo 


esse 


x = de. 


2 


Nach einfachen Umformungen erhalten wir 


Ey) = (do — Qı)?- (17.9.14) 
Schließlich ergibt sich 


log m log ne 
Ey (n) 2 ur 2 (17.9.15) 
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Wir wollen speziell die Werte E, (rn) und E,, (n) berechnen. Da 
L (20) —e 1 —&, 


LQ)=ß 


gilt, erhalten wir aus (17.9.11) und (17.9.12) 


(1 log —# Eee 
Eo,(n) = u = ur “ .(17.9.16) 
FL 2 (Qı ze 2° 
Blog —E-- + Miog—F 
E,,(n) = = n : z (17.9.17) 
> (Qı — 90° 


Wir wollen jetzt wieder die Vorteile feststellen, die sich für das hier be- 
trachtete Problem aus der Anwendung eines sequentiellen Quotiententests 
gegenüber einem klassisch besten Test (siehe 16.3) ergeben. ‘Vor allem inter- 
essieren wir uns für die mittlere Anzahl der Beobachtungen. . 

Die Wahrscheinlichkeiten x und f seien gegeben. Wir wollen die Hypothese 
H,(Q =Q,) gegen die Alternative H,(Q = Qı), Qı > Q. testen, wobei Q der 
unbekannte Mittelwert einer Gesamtheit sei, in der das Merkmal x normal N (Q; 1) 
verteilt ist. Wenn wir einen klassisch besten Test anwenden, so müssen wir die 
Hypothese 7, zugunsten der Hypothese 7, ablehnen, wenn der aus einer ein- 
fachen Stichprobe vom Umfang n ermittelte Wert & die Bedingung T= A 
erfüllt, wobei A durch die Formel (16.3.18) gegeben ist. Nach Formel (16.3.17). 
beträgt der nötige Stichprobenumfang 


(k, — k,)? 
nt, 
(Qı — Ro? 
wobei k, und k, die Relationen 
Pyzk)=e, 
Pysk)=ß 


erfüllen, bei denen die Zufallsvariable y die Verteilung N (0; 1) hat. 
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Wir bezeichnen mit A, und 4, die Quotienten aus #, (rn) bzw. E,,(n) und 
der durch (16.3.17) gegebenen Zahl rn. Dann folgt 


I Ex. (n) (dı — Qu)? m 2 ß 1= ß 
Te Tu 5 ee \ 
(17.9.18) 
E,, 9) (Qı < 2 & ß m 1-8 
En [#108 +1 Blog — | 


(17.9.19) 


Wie wir sehen, hängen A, und A, nur von & und ß ab, nicht aber von Q, und Q,, 
wenn bekannt ist, daß. Q, > Q. Ist. 

Ein ähnliches Ergebnis würden wir erhalten, wenn wir dieHypothese H,(Q =0ı) 
im Vergleich zur Alternative H,(@ =Q,) betrachten, wobei Q, <®% gilt. 

Die Tabelle 17.9.1 bringt die Werte des Produkts 100(1 — A,), während in 
Tabelle 17.9.2 die Werte des Produkts 100(1 — A,) für einige am häufigsten ge- 
brauchte Werte von & und ß eingetragen sind. 


Tabelle 17.9.1. 


100 (1 — &,) 
erg 0,01 0,02 | 0,08 | 0,04 0,05 
0,01 58 54 51 49 47 
0,02 ©” | 56 53 50 49 
0,03 61 57 54 51 50 
0,04 62 58 55 52 50 
0,05 63 59 55 53 51 


Diese Tabellen geben also für den Fall, daß die entsprechende Hypothese H, 
oder H, richtig ist, die durchschnittliche prozentuale Verminderung des Stich- 
probenumfangs bei Anwendung eines sequentiellen Quotiententests anstelle 
eines klassisch besten Tests an. 


Tabelle 17.9.2. 


- 100 (L— 4) 
ws 0,01 0,02 0,03 0,04 0,05 
0,01 58 60 61 62 63 
0,02 54 56 57 58 59 
0,03 51 53 54 55 55 
0,04 49 50 51 52 53 


0,05 47 49 50 50 51 
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Aus diesen Tabellen ist ersichtlich, daß die durchschnittliche prozentuale 
Verminderung der Beobachtungsanzahl außerordentlich groß ist. Sie beträgt 
nämlich ungefähr 50%,. 


17.10.  Schlußbemerkungen 


Abschließend wollen wir über wichtige Ergebnisse auf dem Gebiet der Sequential- 
analyse informieren. 

STEIN [2] hat gezeigt, daß beim sequentiellen Quotiententest die Anzahl n der 
Beobachtungen Momente beliebiger Ordnung besitzt. 

Warp und Worrowızz [4] bewiesen den nachstehenden wichtigen Satz, aus 
dem hervorgeht, daß die in 17.9 bewiesene mittlere Abnahme des Stichproben- 
umfanges im sequentiellen Quotiententest im Vergleich zu den Testen, die auf 
Stichproben konstanten Umfangs beruhen, auch auf alle anderen sequentiellen 
Tests anwendbar ist. Es handelt sich also um eine optimale Eigenschaft, die den 
sequentiellen Quotiententest charakterisiert. Der Satz lautet: 


Satz 17.10.1. Es sei 8, ein sequentieller Quotiententest, der zur Überprüfung 
einer einfachen Hypothese H, im Vergleich zur einfachen Alternativhypothese H, 
dient, und es sei S, irgendein anderer Test, der demselben Zweck dient. Ferner 
mögen &;(8;) und Ei(n) (6,5 = 0,1) die Wahrscheinlichkeit zur Ablehnung der 
Hypothese H, bzw. den erwarteten Stichprobenumfang bedeuten, vorausgesetzt, daß 
die Hypothese H, gilt und der Test S; angewandt wird. Darüber hinaus sei E}(n) 
<oo. Ist dann die Ungleichung 


(8) = 0:80) @=0,1 
erfüllt, so gilt 
Ein) < E;(n). 


Für das in 17.8 behandelte Problem sind viele Modifikationen des sequentiellen 
Quotiententests vorgeschlagen worden, die alle zum Ziel hatten, die optimale 
Eigenschaft beizubehalten, wenn der wahre Wert von Q zwischen Q, und Q, ein- 
geschlossen ist (siehe ARMITAGE [2], KIEFER und Weiss [1] sowie ANDERSoN [2]). 

Bei der Behandlung der Theorie des sequentiellen Quotiententests beschränkten 
wir uns auf den Fall, daß sowohl die Nullhypothese als auch die Alternativ- 
hypothese einfach sind. Der sequentielle Quotiententest läßt sich aber auch zur 
Überprüfung zusammengesetzter Hypothesen anwenden. Informationen zu diesem 
Thema findet der Leser in dem Buch von Warp [4] und in der Arbeit von 
GmrsHick [1]. 

DVOoRETZKY, KIEFER und WoLFowıtz [1] bewiesen, daß die Theorie des sequen- 
tieHen Quotiententests sich auf den Fall übertragen läßt, daß es sich bei dem 
beobachteten Prozeß um einen stochastischen Prozeß mit unabhängigen und 
homogenen Zuwächsen handelt, und somit insbesondere auf den Fall eines 


45 Fisz 
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Poissonschen oder eines Wienerschen Prozesses. In diesem Fall ist die Beob- 
achtungszeit eine Zufallsvariable und spielt eine ähnliche Rolle wie der Stich- 
probenumfang im sequentiellen Quotiententest. Für den Poissonschen Prozeß, 
in dem der Gegenstand der Hypothese der Erwartungswert ist, haben KIEFER 
und WorLrowızz [1] spezielle Tabellen berechnet, die mit der Anwendung des 
sequentiellen Quotiententests zusammenhängen. 

Die Sequentialverfahren lassen sich auch auf Probleme der Schätzung an- 
wenden, worauf bereits WALp [4] selbst hingewiesen hat. WoLrowerz [2] ver- 
allgemeinerte die Ungleichung von RAo-CRAMER für den Fall, daß die Anzahl 
n der Beobachtungen durch ein Sequentialverfahren bestimmt wird, und fand 
Bedingungen, unter denen man in den Ungleichungen (13.5.1) und (13.5.1) 
n durch E(n) ersetzen kann. BLACKWELL und GIRSHIcK [2] fanden Bedingungen 
dafür, daß in den auf diese Weise verallgemeinerten Ungleichungen das Zeichen 
> durch das Gleichheitszeichen ersetzt werden kann. SETH [1] setzte die Unter- 
suchungen von BLACKWELL und GIBSHICK fort. Dem Problem der Gewinnung 
von Konfidenzintervallen bei Sequentialverfahren ist eine Arbeit von Lxim- 
BACHER [1] gewidmet. 

Es sei noch hinzugefügt, daß die Sequentialanalyse nicht nur die Möglichkeiten 
zur besseren Lösung vieler praktischer Probleme schuf, sondern auch das gesamte 
Begriffssystem der mathematischen Statistik erheblich bereichert hat. 


B. Waup [6] schuf darüber hinaus eine neue allgemeine Theorie, die Theorie der 
Enischeidungsfunktionen, die als Spezialfälle sowohl die klassische Testtheorie 
für statistische Hypothesen von NEYMAN-PEARSoN als auch die Sequentialanalyse 
als Spezialfälle umfaßt. Die wichtigsten Ideen dieser Theorie lassen sich wie folgt 
umreißen: Wir bezeichnen mit 2 eine (endliche oder unendliche) Menge der in 
Betracht kommenden zulässigen Verteilungsfunktionen F(x) einer Zufalls- 
variablen X und mit w eine Teilmenge von 2. Als zulässige Hypothese werden 
die Hypothesen HZ, angenommen, wobei der Index w besagt, daß die unbekannte 
Verteilungsfunktion zu » gehört. Eine derart formulierte Hypothese kann sowohl 
eine Konsistenzhypothese als auch eine parametrische Hypothese sein. Die 
Menge der möglichen Entscheidungen, die in der Theorie von NEYMAN-PEARSON 
zwei Elemente enthält, d. h. die Entscheidung der Annahme der zu überprüfenden 
Hypothese und die Entscheidung ihrer Ablehnung zugunsten der Alternativ- 
hypothese, die in der Sequentialanalyse erweitert wurde, unterliegt in der neuen 
Theorie einer weiteren bedeutenden Erweiterung. Dies bezieht sich sowohl auf 
die möglichen endgültigen Entscheidungen über die Gültigkeit einer der Hypo- 
thesen H,, (soleher Entscheidungen kann es unendlich viele geben) als auch 
auf Entscheidungen zur Fortsetzung der Untersuchung, wobei es. unter diesen 
letzten Entscheidungen ebenfalls viele geben kann, wenn wir viele Experimente 
auf einmal durchführen und eine Entscheidung über die Anzahl der fortzusetzen- 
den Experimente treffen müssen. Schließlich werden die Begriffe der Fehler erster 
und zweiter Art in dieser Theorie verallgemeinert, indem man eine Funktion als 
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Maß für die Untersuchungskosten und für den wirtschaftlichen Verlust beim 
Treffen einer falschen Entscheidung einführt. 

In der Theorie der Entscheidungsfunktionen wurde ein neuer Apparat zum 
Testen statistischer Hypothesen entwickelt. 


17.11. _ Aufgaben und Ergänzungen 


1. Es sei {&,} @=1,2,...) eine Folge unabhängiger Zufallsvariabler mit gleicher Ver- 
teilung. Unter dieser Bedingung gilt die. Behauptung des Satzes 17.3.1 dann und nur 
dann, wenn P(z;=0)<1 ist. Man beweise diesen Satz 


&) unter Verwendung des Satzes 17.3.1; 


b) unmittelbar. 


2. Man zeige, daß es für die Gültigkeit von (17.6.2) im sequentiellen Quotiententest genügt, 
anzunehmen, daß E(n) <oo und daß für jedes Q der Erwartungswert Ey(2;) für alle ö 
derselbe ist (KOLMOGOROFF und PROCHOROW [1]; siehe auch BLACKWELL [1)). 

Hinweis. Man werde die Aufgabe 5.14.23 an. 


3. Die Wahrscheinlichkeit 2 (0<p< 1) für das Auftreten eines fehlerhaften Stücks in 
einer Serie von Erzeugnissen ist unbekannt. Wir testen die Hypothese I/,(p = p,) sowie 
die Alternativhypothese H,(p = p1), wobei 9, < p, ist. Dabei wenden wir den folgenden 
Sequentialtest an: Es sei n, eine feste ganze Zahl. Wir greifen nacheinander unabhängige 
Elemente für die Stichprobe heraus. Ist das m-te Stück (m < n,) fehlerhaft, so lehnen 
wir 7, ab; falls jedoch n, Stück fehlerfrei sind, wird 7, akzeptiert. 


a) Man bestimme eine Formel für die Operationscharakteristik dieses Tests. 


b) Wir bezeichnen mit n die Anzahl der Beobachtungen, die zur Entscheidung führt. 
Man bestimme E(n). j 


c) Man setze 2, = 0,05, p, = 0,1,n, = 20 und berechne a, ß und E(n). 


d) Man vergleiche die Güte dieses Tests mit der Güte des sequentiellen Quotiententests 
von 17.8. 


4. (Fortsetzung). Man modifiziere den Test der vorhergehenden Aufgabe folgendermaßen: 
Nach Herausgreifen des m-ten Stücks (m <n, — 1) setzen wir die Untersuchung fort, 
wenn höchstens eines der herausgegriffenen Stücke fehlerhaft ist, und wir lehnen Y, ab, 
wenn wenigstens zwei Stück fehlerhaft sind. Nach Herausgreifen von n, Stück akzeptieren 
wir H,, wenn höchstens ein Stück fehlerhaft ist, und wir lehnen HZ, ab, wenn wenigstens 
zwei Stücke mit einem Fehler behaftet sind. Man beantworte auch hier alle am Schluß 
der vorhergehenden Aufgabe gestellten Fragen. 


5. Man stelle das Vorgehen bei dem sequentiellen Quotiententest in Form einer Markoffschen 
Kette dar. 


6. Die Zufallsvariable X möge die Verteilung N(Q; 0) haben, wobei Q bekannt und o un- 
bekannt ist. Wir prüfen die Hypothese H,(o = o,) im Vergleich zur Alternativhypothese 
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H,(o =0,) mit o, < 0,. Sodann setzen wir 


1 1\-1 ß o? 
Ay = 5: e; ren 5 


1 r) ( om " ) 
1 Be 2log nlog — ]- 
200 & .o2 


a) Mau zeige, daß man beim sequentiellen Quotiententest die Hypothese HZ, annehmen, 
ablehnen oder ebenfalls die Stichprobenerhebung. fortsetzen muß, je nachdem, ob 
Un Am UnmZrm oder a, < Um< rm Ist (Wan [f]). 

b) Man bestimme die Operationscharakteristik dieses Tests und Z {r). 


7. (Fortsetzung). Man beweise: Ist der Parameter @ ebenfalls unbekannt, so muß in dem 
m 


oben beschriebenen sequentiellen Quotiententest Um durch I, (a; — 2)? ersetzt wer- 
i-1 


tt Hm. . r 
ist; ferner ist a, durch @„_, sowie r„, durch 
m 


den, wobei = 


Ym_ı Zu ersetzen (GIRSHICK, STEIN). 


ANHANG 


Der Anhang enthält einen kurzen Abriß über gewisse Elemente der Maßtheorie, 
«lie zum Verständnis einiger in diesem Buch benutzter Begriffe benötigt werden. 
Den Leser, der die allgemeinen Grundlagen der Maßtheorie kennenlernen will, 
die für die Grundlagen der Wahrscheinlichkeitsrechnung benötigt werden, ver- 
weisen wir auf die Bücher von KoLMOGoROFF [7], Doog [5], HArmos [2], Lokve 
[4], Kamke [1], Rıesz und 8z.-Nacy [1] und W. I. Smirvow [2]. 

Im Anhang werden zu den formulierten Sätzen keine Beweise gegeben. Man 
findet sie in den zitierten Monographien. 


Es sei & die Grundmenge (in der Wahrscheinlichkeitsrechnung die Menge der 
Elementarereignisse). Unter Mengen werden wir Teilmengen der Menge E verste- 
hen. 


Definition Al. Es seien A und B Mengen. Die Menge 
A=-B=(A—B)U(B-A) 


nennen wir die symmetrische Differenz der Mengen A und B. 


Definition A2. Unter einem Mengenring (oder Booleschen Ring) verstehen 
wir eine nichtleere Klasse R von Mengen derart, daß aus den Beziehungen 


AeR und BeR (Al) 
die Beziehungen 


(AUB)ER und (A—-B)ER (A2) 


folgen. 
Aus der Definition A 1 gcht hervor, daß (A — B)E R gilt, wenn die Bezichun- 
gen (A 1) erfüllt sind. Wegen ANB=AUB-(A-B) folgt somit aus (A 1) 


z 


(ANBJER. (A 3) 


Mit Hilfe der vollständigen Induktion finden wir den folgenden Zusammenhang: 
Ist R ein Mengenring, so folgt für jedes endliche n aus den Beziehungen 


Ae€ER G=1,2,...,n) (A1’) 
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die Bezichung 
(0.4) ek. (A2') 
il 


Beispiel A 1. Wir wählen für % die reelle Zahlengerade und für R die Klasse aller endlichen 
Vereinigungen beschränkter halboffener Intervalle der Form [a, 5). Dann ist R ein Mengenring. 


Definition A3. Einen Mengenring Z, der die Grundmenge E enthält, nennen 
wir eine (Boolesche) Mengenalgebra. 

Ist R eine Mengenalgebra, so folgt aus A € R die Bezichung A = (E— A)ER. 

Definition A 4. Unter einem o-King von Mengen verstehen wir eine nichtleere 
Klasse von Mengen derart, daß aus der Beziehung 


A;€&ER @=1,2,...) (A4) 
die Beziehungen 
(Ü A)eR, (A 5) 
i=1 " 
(Au —A)ER (A 6) 


folgen. 


Definition A5. Einen o-Mengenring, der die Grundmenge # enthält, nennen 
wir eine o-Mengenalgebra (oder einen Borelschen Mengenkörper). 

Die Definition A5 ist der folgenden Definition gleichwertig: Unter einer 
o-Algebra (bzw. einem Borelschen Mengenkörper) R verstehen wir eine nichtleere 
Klasse von Mengen derart, daß aus der Bedingung (A 4) die Beziehung (A 5) 
und aus der Bedingung AE R die Beziehung A ER folgt. 

Wir verweisen den Leser auf die Aufgabe 1.8.6. 


Definition AG. Es sei K eine gewisse Klasse von Mengen. Wir nennen den 
kleinsten Mengenring (o-Ring), der die Klasse X enthält, einen von der Klasse K 
erzeugten Ring und bezeichnen ihn mit g(K). 

Es läßt sich zeigen, daß zu jeder Klasse K von Mengen ein eindeutig bestimmter 
Ring (o-Ring) existiert, der von der Klasse K erzeugt wird. 


Beispiel A 2. Wir wählen als E die reelle Zahlengerade und als Klasse K die Klasse aller 
beschränkten halboffenen Intervalle der Form [a, 5). Der von der Klasse K erzeugte Mengen- 
ring ist der im Beispiel A 1 betrachtete Ring. Der von der Klasse K erzeugte o-Ring ist die 
Klasse aller Borelschen Mengen auf der Zahlengeraden. Dieser o-Ring ist gleichzeitig eine 
-o-Algebra, da er die gesamte Gerade als Vereinigung abzählbar vieler Intervalle der Form 
[e, 5) enthält. 


Definition A7. Eine Mengenfunktion ist eine Funktion, deren Definitions- 
bereich eine gewisse Klasse von Mengen ist. 

Eine Mengenfunktion u, die auf einer Klasse K von Mengen definiert ist, 
nennen wir endlich additiv, wenn für n=1,2,... und für alle paarweise fremden 
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Mengen A,EK ii =1,2,...,n) 


P (Ü A) Ina) (an 
Äi i=1 . 


gilt. Wir-nennen eine Funktion u eine abzählbar additive (absolut additive oder 
total additive) Funktion, wenn für jede Folge paarweise disjunkter Mengen 
A,eK(üi=1,2,...) die Beziehung 


„(3.4) = Zua) (AT) 
gilt. 


Definition A8. Ein Maß u ist eine reellwertige nichtnegative abzählbar 
additive Mengepfunktion u(4), die auf einem Borelschen Mengenkörper .F 
definiert ist und der Bedingung „(0) = 0 genügt. Wir nennen ein Maß u endlich, 
wenn u(E) < oo ist; ein Maß u nennen wir ein Wahrscheinlichkeitsmaß, wenn 
a(E)=1 ist. 

Ein Maß u nenfien wir o-endlich, wenn eine Mengenfolge {A,} im Borelschen 
Mengenkörper # derart existiert, daß Zc (0 ) und 4(4,)<oo für 
n=1,2,... gilt. 

Das Tripel (E, #, a) nennen wir einen Maßraum. Ist u(B) < 00, So sagen wir, 
der Maßraum sei endlich. Ist u(E) = 1, so nennen wir das Tripel (E, 3, u) ein 
Wahrscheinlichkeitsfeld. 

Der nachstehende wichtige Satz, den man als den Erweiterungssatz bezeichnet, 
zeigt, daß die Voraussetzung, daß das Wahrscheinlichkeitsmaß P(A) für jede 

' Teilmenge A im Borelschen Mengenkörper definiert ist, durch die erheblich 
schwächere Voraussetzung ersetzt werden kann, daß P(A) für jede Teilmenge 4 
in einer kleineren Mengenalgebra gegeben ist. 


Erweiterungssatz. Es sei u(A) ein auf einer gewissen Algebra R von Teil- 
mengen von E definiertes o-endliches Maß. Dann läßt sich die Funktion u(A) in 
eindeutiger: Weise auf alle Mengen aus der Klasse g(R) ausdehnen, ohne daß eine 
der Eigenschaften der Funktion u(A) (nichtnegativ und abzählbar additiv zu sein) 
verlorengeht. 


Es sei $ eine beschränkte Menge auf der reellen Zahlengeraden. Wir wählen 
E = (a,b), wobei (a,5) > $ ist. Daraus folgt S = (a,b) — 8. Wir bezeichnen 
mit U eine endliche oder abzählbare Vereinigungsmenge von Intervallen derart, 
daß 


SCUc (a,b) (A 8) 


gilt. Wir stellen U als Vereinigung von disjunkten Intervallen dar (siehe Aufgabe 
1.8.5) und wählen als Maß L(U) die Summe ihrer Längen. 
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Definition A9. Die untere Grenze L(U), erstreckt über alle U, die der 
Bedingung (A 8) genügen, nennen wir das äußere Maß der Menge 8. u be- 
zeichnen es mit L($). 

Der Ausdruck L($)=b —a— L($) heißt inneres Maß der Menge $. Eine 
Menge 8 nennen wir meßbar im Lebesgueschen Sinne (oder kurz L-meßbar), wenn 
L(S) = L(8) gilt. Diesen gemeinsamen Wert bezeichnen wir mit L($). 


Definition A 10. Es sei 8 eine unbeschränkte Menge auf der Zahlengeraden x. 
Eine Menge 8 ist L-meßbar, wenn für jedes x > 0 der Durchschnitt [-x,2]NS 
L-meßbar ist. 

Es läßt sich zeigen, daß die Mengenfunktion 2.8), die durch die Definitionen 
A 9 und A 10 gegeben ist, ein auf dem Borelschen Mengenkörper der L-meßbaren 
Mengen auf der Zahlengeraden definiertes Maß ist, das die folgende Eigen- 
schaft hat: Ist $ ein endliches Intervall (a, b), so gilt 


L($S)=b—.a. 


Jede Borelsche Menge auf der Zahlengeraden ist L-meßbar, doch gilt die um- 
gekehrte Behauptung nicht: Es existieren L-meßbare Mengen, die keine Borel- 
schen Mengen sind. Ist jedoch eine Menge S zwar L-meßbar, aber keine Borelsche 
Menge, so läßtssie sich in der Form $ = 8, U 8, darstellen, wobei S, eine Borelsche 
Menge und S, eine L-meßbare Menge mit L(S,) = 0 ist. 


Definition Ail. Wir sagen, daß das auf einem Borelschen Mengenkörper 
F definierte Maß u vollständig ist, wenn die Bedingungen A€EF, BA und 
a(A) =0 die Beziehung BE 5 nach sich ziehen, 


Das Lebesguesche Maß ist vollständig. 


Die Verteilungsfunktion einer Zufallsvariablen vom diskreten (stetigen) Typ 
werden wir als Verteilungsfunktion vom diskreten (stetigen) Typ bezeichnen. 
Jede Verteilungsfunktion F(x) läßt sich in der Form 


F(2) =a,F, (x) + a,P,(2) + af’; (x) 20; +, +%,=1) 


darstellen, wobei F,(x) bzw. F,(x) Verteilungsfunktionen vom stetigen bzw. 
diskreten Typ sind, während F,(x) eine singuläre Verteilungsfunktion ist. Das 
heißt, F,(x) ist eine stetige Funktion, und ihre Ableitung F% (x) ist fast überall 
gleich Null (d. h. überall, außer in den Punkten, die zu einer Menge vom Lebesgue- 
schen Maß Null gehören). 

Ist , =a, =0, so ist die Verteilungsfunktion Fix) vom stetigen Typ. Ist 
hingegen a, = a, =), so ist die Verteilungsfunktion F(x) diskret. Wir geben nun 
ein Beispiel einer Verteilungsfunktion, für die , =a =0 ist. 
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Beispiel A3. Wir teilen das Intervall [0, 1] in die beiden Teile G, und 7‘, auf folgende 
Weise: 


a j.8 12 78 
esjafi- dub] 
1 2 278 19 20\. [25 26 
lea) rev [U 


1 2 78 = 3" —-—6 3#2—5 3” —2 9m —1 
U zu’ 3m U U U zu zu zT nn Ur, 


T,=[0,1]- 6,. 


Die Mengen T, und @, heißen Oantorsche Mengen. T, ist eine Menge vom Lebesgueschen 
‚Maß Null. 


Wir bezeichnen mit 9, (n =1,2,...;k=1,2,...,2°-!) das k-te Intervall mit dem Nen- 
ner 3". Dann definieren wir F (x) wie folgt: ' 


0 für =<s0, 
2k —1i 

Fk) = für x € Gem» 
1 für 221. 


Schließlich erhält man für ©, € 7, 


F(&) = sup F(«). 
a< 
TEGo 
Das so definierte F'(x) ist eine stetige Verteilungsfunktion, deren Ableitung für jedes 
x eG, verschwindet. Es existiert hier demnach keine Funktion f(x), die der Beziehung 
(2.3.4) für jedes reelle x genügt. 


Es ist wichtig, festzustellen, daß bei unabhängigen Zufallsvariablen X, und 
X,, deren Verteilungsfunktionen F, (x) und F,(x) singulär sind, die Verteilungs- 
funktion F(x) der Summe X, + X, absolut stetig sein kann (siehe RangAa-RAo 
und VARADARAJAN [1]). 


Es sei (Z,F, u) ein endlicher Maßraum. Ferner sei fle), ee E, eine reelle, 
bezüglich 7 meßbare (vgl. Definition 2.1.2 sowie die zugehörige Fußnote) 
und beschränkte Funktion: —o<a<sffe)<b< 0. Wir bezeichnen mit 
ulc <fle)<c”,ee A), wobei AEF ist, das Maß des Durehschnitts von A 
mit dem Urbild von (c’, c”), aus dem (c’, c’’) durch die Funktion f entstanden ist. 


Definition A 12. Existiert der Grenzwert des Ausdrucks 


lim lim Foul. si< c„eeA), . (A 9) 


0 n>oo i=1 
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wobei a =9<4G%<--<c„=b und max (; — 6,)Se ist, so nennen wir - 
Iisisn 


diesen Grenzwert das abstrakte Lebesguesche Integral von / über der Menge A: 
bezüglich des Maßes u. Wir bezeichnen es wie folgt: 


Stau 


Ist die Funktion f(e) beschränkt, so existiert das Kan, für jedes AE F und 
insbesondere für A = E. Falls die Funktion f(e) unbeschränkt ist, verfahren wir 
wie folgt: Wir setzen für jedes ae und db mit a<b 

a für fle)<ae, 
fan(e) =! fle) für a<fl)<b, 
b für fe)>b. 


Definition A 12’. Existiert der Grenzwert 


im  f Fat (e) du, (A9') 
> A 
b>o 


so nennen wir ihn das abstrakte Lebesguesche Integral der Funktion f über der 
Menge A bezüglich des Maßes u. 

Wir wollen nun einige wichtige Eigenschaften des Lebesgueschen Integrals 
anführen. 


I. Ist die Funktion f über der Menge A integrierbar und ist A = Y An (An€ I; 


n= 1, 2, ...), wobei die Mengen A, paarweise disjunkt sind, so gilt 
[rau= x [tan 
A n An 


II. Ist die Funktion f integrierbar, so ist auch |f] eine integrierbare Funktion. 


III. Sind f, und f, integrierbare Funktionen und c, und c, reelle Konstanten, 
so ist auch die Funktion c,fi + C3fs integrierbar, und es gilt 


S (afı + of)du = a Shan A “ Urdu. 
Wir wählen jetzt als u das Wahrscheinlichkeitsmaß P; f sei die charakteristische 
Funktion der Menge AE 5, d.h., es sei 


Ih für ecA, 


fe = 0 für e&A. 


Dann gilt 
[rap =Pia). 
4 
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Nun sei X eine Zufallsvariable mit der Verteilungsfunktion F(x), und S sei 
eine Borelsche Menge über der reellen Zahlengeraden. Dann ist 


Pa (8) = PR(XeE8)= [dF(e)= [dP=P(A), 
5 A 


wobei A das Urbild von $ ist. 


Eine völlig analoge Formel gilt für Zufallsvektoren in n-dimensionalen euklidi- 
schen Räumen. 
Existiert der Erwartungswert E (X), so gilt 


E(X Era [rare -  [rare. 


IstX=(X,X,...,X,) ein Zufallsvektor und g(X, X» .. 
variable, deren Erwartungswert existiert, so ist 


.‚X,„) eine Zufalls- 


x 


Elg(X 1, ..., Xn)] = [gap = je [gap m. 
E 60 


oo 


Bevor wir den Satz von Fusixı formulieren, führen wir einige Begriffe ein. 


Definition A13. Es seien (E,F,u,) i = 1,2) zwei Maßräume. Das Tripel 
(E,F, u) nennen wir das kartesische Produkt der Maßräume (E,, F], u) und 
(E,, F 4), wenn die nachstehenden Bedingungen erfüllt sind. 


IL.E=E,xE, ist die Menge aller Paare e= (e,&) mit &€ B.. 


I1.#°=%#,xF, ist der von den Rechtecken A =4,x4, erzeugte Borelsche 
Mengenkörper, wobei A;€ 5, ist (mit anderen Worten, ee A bedeutet, daß 
e = (&,, &) gilt, sofern e;€ A, ist). 


III. Für jedes A =4A,x A, mit A,€ 7, haben wir u(A) = u (4) 42(A,). Das 
Maß u nennen wir das kartesische Produkt der Maße u, und u, und bezeichnen es 
mit 4X le. 


Beispiel A4. Es seien X und Y zwei unabhängige Zufallsvariable. Wir wählen die x- 
Achse, die y-Achse und die x,y-Ebene als die Mengen E,, E, und E sowie die Klassen der 
Borelschen Mengen F,, F, und F(,,„, über den Mengen Z,, E, und E als F,, F, und # 
Für die Maße u,; u, und u schließlich wählen wir die Wahrscheinlichkeitsmaße P@), P@) und 
P(«w) der Zufallsvariablen X, Y und (X, Y). Dann ist (E, 3, (9, PR9)) das kartesische 
Produkt der Maßräume (Z,, F,, PC) und (BE, F, PW). 


Definition A13’. Essei AEF(A4 = A,x As). Als Schnitt der Menge A in 
einem gegebenen Element e,(e,) bezeichnen wir die Menge aller Elemente e,(e,) 
derart, daß (e,,e)€ A ist. Für diesen Schnitt schreiben wir A, (4,). 
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Es sei f eine auf der Menge E erklärte, bezüglich 7 meßbare reelle Funktion. 
Als Schnitt f, (f,,) der Funktion f im gegebenen Element e,(e,) bezeichnen wir 
die Funktion, die auf der Menge Z,(E,)-durch die Beziehung f, (e,) = fle,; &) 
(oder f,,(e) = f(eı, e;)) erklärt ist. 


Satz von FugBInt. Es seien (E, I, m) ( =1,2) zwei endliche Maßräume. 
Ist die auf der Menge E,xE, definierte Funktion f(e, €) bezüglich F, x F5 
meßbar und nichtnegativ oder integrierbar auf der Menge E=E,xE, nach dem 
Maß u = u Xu, So ist 


[tan = [au [te dus = | An [ h.te) dm: (A 10) 
E Eı E; Er Eı 


Im Fall der Integrabilität sind jast alle Schnitte a mit Ausnahme einer 
Menge vom Maß Null) integrierbar. 


Die Integrale auf der rechten Seite von (A 10) sind der Reihe nach von rechts 
nach links zu berechnen. 

Ist f charakteristische Funktion der Menge A € 7, so nimmt die Beziehung 
(A 10) die folgende Form an: 


— [ (4) dm = | m(A,) dan (A 11) 
E, Er 


Der Satz von Fusini gestattet uns, einen einfachen Beweis für die Formeln 
(6.5.6) bis (6.5.9) zu geben. Wir wollen etwa die Formel (6.5.6) beweisen. 

Es seien X und Y unabhängige Zufallsvariable; Z = f(X, Y) sei ebenfalls eine 
Zufallsvariable; ihr Wahrscheinlichkeitsmaß sei P®. Ferner sei $ eine Borelsche 
Menge auf der z-Achse und A eine Menge in der x, y-Ebene mit der folgenden 
Eigenschaft: Für (x, y) € A ist fix, y) € 8. Ausder Beziehung (A 11) folgt dann 
(vgl. Beispiel A 4) wegen Pew(A) = P®(S) 


P&O(S) = f Po (A, 2. — [ Po(4,)dPp®; (A 12) 
dabei ist A, (4,) die Menge aller der Punkte auf der y-Achse (x-Achse), bei denen 
für ein gegebenes x (y) die Beziehung f(x,y)€ $ gilt. 

Wir bezeichnen mit F,(&), F,(y) bzw. F(z) die Verteilungsfunktionen der 
Zufallsvariablen X, Y bzw. Z. Setzen wir 8 = (- 0,2)undZ=X -+Y, sofolst 


PO(S)=F(), P®(A)=PF@—a), P9(A)=F@-y). (A13) 


Aus (A12) und (A 13) erhalten wir sofort die Formel (6.5.6). Die übrigen drei 
Formeln lassen sich in der gleichen Weise gewinnen. 

Mit Hilfe des Satzes von Fuginı läßt sich auch die nachstehende Umkehrung 
zu Satz 3.6.2 beweisen. 
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Es seien X und Y unabhängige Zufallsvariable, die die Beziehungen 
PX=0)=#+1, PY=0)+#1 (A 14) 


erfüllen, und es existiere der Erwartungswert E(XY). Dann existieren auch die 
Erwartungswerte E(X) und E(Y), und es gilt 


E(XY)=E(X)E(T). (A 15) 


Zum Beweis nehmen wir als Funktion f aus der Beziehung (A 10) das Produkt 
XY. Der Schnitt der Funktion f in einem gegebenen Punkt = ist xy bei kon- 
stantem x; beachtet man die Beziehung (A 14), so ergibt sich aus (A 10) 


E(XY) = [ Saar» = | [varwape = Bin). 


-0> 00 


Die Existenz und Eindeutigkeit der bedingten Erwartungswerte und der be- 
dingten Wahrscheinlichkeit, wie sie in 3.6.C besprochen wurden, folgen leicht 
aus dem Satz von RADon-NIKODYM. 

Essei(F, 4, „) ein Maßraum und V (A) eine abzählbar additive Mengenfunktion, 
die für 4 € # definiert ist. Ferner möge V (A) höchstens einen der Werte — oo 
und oo annehmen. 

Wir sagen, daß die Mengenfunktion V absolut stetig bezüglich des Maßes u ist 
(wir schreiben dafür: V < u), wenn für jedes A € F die Gleichung „(A) =0 
die Beziehung V(A) =0 nach sich zieht. 

Ist die Funktion V endlich, nichtnegativ und ist V < u, so existiert zu jedem 
e>0 ein ö>0 derart, daß die Beziehung u(A) > ö die Beziehung V(A)<e 
nach sich zieht. 


Satz von RApon-NIKoDYM. Es sei (E, F, P) ein Wahrscheinlichkeitsfeld und 
Q(A) (AEF) eine abzählbar additive endliche Mengenfunktion. It Q<P, so 
existiert eine Zufallsvariable f(e) derart, daß für jedes Ac F die Beziehung 


Q4) = [ fi)dP (A 16) 
4 
erfüllt ist. 


Die Zufallsvariable f(e) ist in dem Sinne eindeutig bestimmt, daß dann, wenn 
für eine andere Zufallsvariable g(e) für jedes AE F° die Beziehung 


Q4) = [ gle)dP 


gilt, die Beziehung Plfte) = g(e)] = folgt. 
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Es sei (X, Y) ein Zufallsvektor, und es möge der Erwartungswert E(Y) 
existieren. 


Definition A 14. Die Zufallsvariable #(Y|x), die für jede Borelsche Menge 
S auf der x-Achse, für die P®(Xe€8)>0 gilt, die Beziehung 


E(YIXE 8) = BIBY|m)IX € 8] (A 17) 


erfüllt, nennen wir den bedingten Erwartungswert der Zufallsvariablen Y bei 
gegebenem x. j 

Wir beweisen die Existenz und Eindeutigkeit (in dem im Satz von RADoN- 
NikoDyM formulierten Sinne) des bedingten Erwartungswertes E(Y|x). 

Es ist hier zweckmäßig, mit {X € 8} das Urbild der Borelschen Menge $ zu 
bezeichnen, das durch die Zufallsvariable X gegeben ist. Multiplizieren wir beide 
Seiten von (A 17) mit P(X € 8), so erhalten wir 


[yap= [EYI)dP = [E(Y|a)dp®. (A 18) 
{Xes} 1Xes} Ss 
Nun sei 
- Q)= [yar. 


{Xes} 


- Die Funktion Q($) ist offenbar abzählbar additiv. Darüber hinaus ist Q($) 
absolut stetignach dem Maß P(®, denn die Gleichung P(” (8) = 0 ist der Gleichung 
P(Xes8)=0 äquivalent, und aus dieser folst Q(5) = 0. 

Wie wir sehen, sind die Voraussetzungen des Satzes von RADoNX-NIKODYM 
erfüllt, wenn wir für die Menge E die x-Achse, für 7 die Klasse der Borelschen 
Mengen auf dieser Achse und für P das Maß P(® wählen. Demzufolge ist die 
Behauptung des Satzes von RADon-NikoDyM für E(Y|x) zutreffend. 
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Tafel I. Die Poissonsche Verteilung 
Die Werte der Wahrscheinlichkeitsfunktion 


PX=r= Fr 
ro 


einer Zufallsvariablen X mit Poissonscher Verteilung 


Ä 

: 0,1 0,2 0,3 0,4 0,5 

0 | 0,904837 | 0,818731 | 0,740818 | 0,670320 | 0,606531 
1 |0,090484 | 0,163746 | 0.222245 | 0.268128 | 0.303265 
2 |0,004524 | 0.016375 | 0.033337 | 0.053626 | 0.075816 
3 [0.000151 | 0,001092 | 0.003334 | 0.007150 | 0.012636 
4 |0,000004 | 0,000055 | 0.000250 | 0.000715 | 0.001580 
5 —  |0,000002 | 0,000015 | 0,000057 | 0.000 158 
6 = — | 0.000001 | 0,000004 | 0.000013 
7 Ei = —- 1. = 10.000001 
8 = ur = ge un 

A 

i 0,9 1,0 1,5 2,0 2,5 

0 10,406570 | 0,367879 | 0,223 130 | 0,135335 | 0,082085 
1 |0,365913 | 0.367879 | 0.334695 | 0.270671 | 0.205212 
2 |0,164661 | 0.183940 | 0.251021 | 0.270671 | 0.266516 
3 |0,040398 | 0.061313 | 0,125510 | 0.180447 | 0.213763 
4 |0,011115 | 0.015328 | 0,047067 | 0.090224 | 0.133602 
5 |0,002001 | 0.003066 | 0.014120 | 0.036089 | 0.066801 
6 | 0,000300 | 0.000311 | 0.003530 | 0.012030 | 0.027834 
7 | 0000038 | 0.000073 | 0.000756 | 0.003437 | 0.009941 
8 | 0.000008 | 0,000008 | 0,000142 | 0.000859 |.0.003 106 
9 — [0.000001 |'0.000024 | 0,000191 | 0.000863 
10 = —  [0,000004 | 0.000088 | 0.000216 
11 = 2. — 10.000007 | 0.000049 
12 & br — 0.000001 | 0.000010 
13 = = ® — [0.000002 
14 = = = = = 

15 = = = e = 

16 = = = = =; 

17 z & = = 


0,6 


0,548812 
0,329287 
0,098786 
0,019757 
0,002964 
0,000356 
0,000036 
0,000003 


3,0 


0,049 787 
0,149361 
0,224.042 
0,224.042 
0,168031 
0,100819 
0.050409 
0,021604 
0,008102 
0,002701 
0,000810 
0,000221 
0,000055 
0,000013 
0,000003 
0,000001 


0,7 


0,496585 
0,347 619 
0,121663 
0,028388 
0,004 988 
0,000 696 
0,000081 
0,000008 
0,000001 


3,5 


0,030 197 
0,105691 
0,184959 


0,215785 


0,188812 
0,132169 
0,077098 
0,038 549 
0,016865 
0,006559 
0,002296 
0,000730 
0,000213 
0,000057 
0,000014 
0,000003 
0,000001 


0,8 


0,449 329 
0,359463 
0,143785 
0,038 343 
0,007 669 
0,001 227 
0,000 164. 
0,000019 
0,000002 


4,0 


0,018316 
0,073263 
0,146525 
0,195367 
0,195367 
0,156293 
0,104196 
0,059 540 
0,029 770 
0,013231 
0,005.292 
0,001 925 
0,000642 
0,000197 
0,000056 
0,000015 
0,000004 
0,000001 
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Fortsetzung von Tafel I 


4,5 5,0 6,0 7,0 8,0 9,0 10,0 


0,011109 | 0,006738 | 0,002479 | 0,000912 | 0,000335 | 0,000123 | 0,000045 
0,049990 | 0,033690 | 0,014873 | 0,006383 } 0,002684 | 0,001111 | 0,000454 
0,112479 | 0,083224 | 0,044618 | 0,022341 | 0,010735 | 0,004998 | 0,002270 
0,168718 | 0,140374 | 0,089235 | 0,052129 | 0,028626 | 0,014994 | 0,007567 
0,189808 | 0,175467 | 0,133853 | 0,091226 | 0,057252 | 0,033737 | 0,018917 
0,170827 | 0,175467 | 0,160623 | 0,127717 | 0,091604 | 0,060727 | 0,037833 
0,128120 | 0,146223 | 0,160623 |.0,149003 | 0,122138 | 0,091090 | 0,063055 
0,082363 | 0,104445 | 0,137677 | 0,149003 | 0,139587 | 0,117116 | 0,090079 
0,046329 | 0,065278 | 0,103258 | 0,130377 | 0,139587 | 0,131756 | 0,112599 
0,023165 | 0,036266 | 0,068838 | 0,101405 | 0,124077 | 0,131756 | 0,125110 
10 0,010424 | 0,018133 | 0,041303 | 0,070983 | 0,099262 | 0,118580 | 0,125110 
11 0,904264 | 0,008242 | 0,022529 | 0,045171 | 0,072190 |: 0,097020 | 0,113736 
12 0,001599 | 0,003434 | 0,011264 | 0,026350 | 0,048127 | 0,072765 | 0,094780 
13 0,000554 | 0,001321 | 0,005199 | 0,014188 | 0,029616 | 0,050376 | 0,072908 
14 0,000178 | 0,000472 | 0,002228 | 0,007094 | 0,016924 | 0,032384 | 0,052077 
15° 0,000053 | 0,000157. | 0,000891 | 0,003311 | 0,009026 | 0,019431 | 0,034718 
16 0,000015 | 0,000049 | 0,000334 | 0,001448 | 0,004513 | 0,010930 | 0,021699 
17 0,000004 | 0,000014 | 0,000118 | 0,000596 | .0,002124 | 0,005786 | 0,012764 
18 0,000001 | 0,000004 | 0,000039 | 0,000232 | 0,000944 | 0,002893 | 0,007091 


soon ruwnvnro 


19 _ 0,000001 | 0,000012 | 0,000085 | 0,000397 | 0,001370 | 0,003732 
20 _ = 0,000004 | 0,000030 | 0,000159 | 0,000617 | 0,001866 
21 _ _ 0,000001 | 0,000010 | 0,000061 | 0,000264 | 0,000889 
22 = _ = 0,000003 | 0,000022 | 0,000108 | 0,000404 
23 — — — 1 .0,000001 | 0,000008 | 0,000042 | 0,000176 
24 _ N. _ _ 0,000003 | 0,000016 | 0,000073 
25 —_ _ = _ 0,000001 | 0,000006 | 0,000029 
26 _ - _ —_ _ 0,000002 | 0,000011 
27 _ _ _ _ _ 0,000001 | 0,000004 
28 _ _ _ _ _ —_ 0,000001 
29 _ _ —_ —_ _ —_ 0,000001 
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Tafel II. Die Normalverteilung 
Die Werte der Dichte 


einer Zufallsvariablen X mit der Normalverteilung N (0; 1) 


1 ->= 
ı)= —e 2 
p(%) Vor 

= | om | = | vw 
0,00 | 0,3989 | 0,50 | 0,3521 
0,05 | 0,3984 | 0,55 | 0,3429 
0,10 | 0,3970 | 0,60 | 0,3332 
0,15 | 0,3945 | 0,65 | 0,3230 
0,20 | 0,3910 | 0,70 | 0,3123 
0,25 | 0,3867 | 0,75 | 0,3011 
0,30 | 0,3814 | 0,80 | 0,2897 
0,35 | 0,3752 | 0,85 | 0,2780 
0,40 | 0,3683 | 0,90 | 0,2661 
0,45 | 0,3605 | 0,95 | 0,2541 


Tafel III. Die Normalverteilung 
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= | vo | = | vw | = | vw | = | vw 

1,00 | 0,2420 | 1,50 | 0,1295 | 2,00 | 0,0540 | 2,50 | 0,0175 
1,05 | 0,2299 | 1,55 | 0,1200 | 2,05 | 0,0488 | 2,55 | 0,0154 
1,10 | 0,2179 | 1,60 | 0,1109 | 2,10 | 0,0440 | 2,60 | 0,0136 
1,15 | 0,2059 | 1,65 | 0,1023 | 2,15 | 0,0396 | 2,65 | 0,0119 
1,20 | 0,1942 | 1,70 | 0,0940 | 2,20 | 0,0355 | 2,70 | 0,0104 
1,25 | 0,1826 | 1,75 ! 0,0863 | 2,25 | 0,0317 | 2,75 | 0,0091 
1,30 | 0,1714 | 1,80 | 0,0790 | 2,30 | 0,0283 | 2,80 | 0,0079 
1,35. | 0,1604 | 1,85 | 0,0721 | 2,35 | 0,0252 | 2,85 | 0,0069 
1,40 | 9,1497 | 1,90 | 0,0656 | 2,40 | 0,0224 | 2,90 | 0,0060 
1,45 | 0,1394 | 1,95 | 0,0596 | 2,45 | 0,0198 | 2,95 | 0,0051 

ö 3,00 | 0,0044 


Die Werte der Verteilungsfunktion 


ee fr 
vr, 


e 


dt 


einer Zufallsvariablen X mit der Normalverteilung N (0; 1) 


| &(a) l=| 0) |2| eo |: | 50 | «| 2 || &(a) 


0,00 
0,05 
0,10 
0,15 
0,20 
0,25 
0,30 
0,35 
0,40 
0,45 


0,500000 
0,519939 
0,539 828 
0,559618 
0,579260 
0,589706 
0,617 911 
0,636831 
0,655422 
0,673645 
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0,50 
0,55 
0,60 
0,65 
0,70 
0,75 
0,80 
0,85 
0,90 
0,95 


0,691463 
0,708840 
0,725747 
0,742154 
0,758036 
0,773373 
0,788145 
0,802 338 
0,815940 
0,828 944 


1,00 
1,05 


1,10. 


1,15 
1,20 
1,25 
1,30 
1,35 
1,40 
1,45 


0,841 345 
0,853141 
0,864 334 
0,874928 
0,884 930 
0,894. 350 
0,903200 
0,911492 
0,919243 
0,926471 


1,50 
1,55 
1,60 
1,65 
1,70 
1,75 
1,80 
1,85 
1,90 
1,95 


0,933193 
0,939429 
0,945 201 
0,950528 
0,955434 
0,959 941 
0,964070 
0,967 843 
0,971.283 
0,974412 


2,00 
2,05 
2,10 
2,15 
2,20 
2,25 
2,30 
2,35 
2,40 
2,45 


0,977250 
0,979 818 
0,982136 
0,984222 
0,986097 
0,987 776 
0,989 276 
0,990613 
0,991802 
0,992 857 


2,50 
2,55 
2,60 
2,65 
2,70 
2,75 
2,80 
2,85 
2,90 
2,95 
3,00 


0,993 790 
0,994. 614 
0,995 339 
0,995 975 
0,996 533 
0,997 020 
0,997445 
0,997 814 
0,998134 
0,998411 
0,998650 
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Tafel 1V. Die ?-Verteilung 


Die Tafel gibt die Werte von x? für einige Werte & an. Dabei ist y? so bestimmt, daß die 
Wahrscheinlichkeit dafür, daß die Zufallsvariable x? mit n Freiheitsgraden nicht kleiner als 
x: ist, gleich « ist: 


j & 
0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,02 0,01 
| | I 


0,064 0,148 0,455 1,074 | 1,642 | 2,706 | 3,841 | 5,412 | 6,635 
0,446 0,713 1,386 2,408 | 3,219 | 4,605 | 5,991 | 7,824 | 9,210 

: 1,005 1,424 2,366 3,665 | 4,642 | 6,251 | 7,815 | 9,837 | 11,345 
1,649 2,195 3,357 4,878 | 5,989 |. 7,779. | 9,488 | 11,668 | 13,277 
2,343 3,000 4,351 6,064 | 7,289 | 9,236 | 11,070 | 13,388 | 15,086 
3,070 3,828 5,348 7,231 | 8,558 | 10,645 | 12,592 | 15,033 | 16,812 
3,322 4,671 6,346 8,383 | 9,803 | 12,017 | 14,067 | 16,622 | 18,475 
4,594 5,527 7,344 9,524 | 11,030 | 13,362 | 15,507 | 18,168 | 20,090 
5,380 6,393 8,343 | 10,656 | 12,242 | 14,684 | 16,919 | 19,679 | 21,666 
10 6,179 7,267 9,342 | 11,781 | 13,442 | 15,987 | 18,307 | 21,161 | 23,209 
11 6,989 8,148 | 10,341 | 12,899 | 14,631 | 17,275 | 19,675 | 22,618 | 24,725 
12 7,807 9,034 | 11,340 | 14,011 | 15,812 | 18,549 | 21,026 | 24,054 | 26,217 
13 8,634 9,926 | 12,340 | 15,119 | 16,985 | 19,812 | 22,362 | 25,472 | 27,688 
14 9,467 | 10,821 | 13,339 | 16,222 | 18,151 | 21,064 | 23,685 | 26,873 | 29,141 
15 10,307 | 11,721 14,339 | 17,322 | 19,311 | 22,307 | 24,996 | 28,259 | 30,578 
16 11,152 | 12,624 | 15,338 | 18,418 | 20,465 | 23,542 | 26,296 | 29,633 | 32,000 
17 12,002 | 13,531 16,338 | 19,511 | 21,615 | 24,769 | 27,587 | 30,995 | 33,409 
18 12,857 | 14,440 | 17,338 | 20,601 | 22,760 | 25,989 | 28,869 | 32,346 | 34,805 
19 13,716 | 15,352.| 18,338 |-21,689 | 23,900 | 27,204 | 30,144 | 33,687 | 36,191 
20 14,578 | 16,266 | 19,337 | 22,775 | 25,038 | 28,412 | 31,410 | 35,020 | 37,566 
21 15,445 |.17,182 | 20,337 | 23,858 | 26,171 | 29,615 | 32,671 | 36,343 | 38,932 
22 16,314 | 18,101. | 21,337 | 24,939 | 27,301 | 30,813 | 33,924 | 37,659 | 40,289 
23 17,187 | 19,021 | 22,337 | 26,018 | 28,429 | 32,007 | 35,172 | 38,968 | 41,638 
24 18,062 | 19,943 | 23,337 | 27,096 | 29,553 | 33,196 | 36,415 | 40,270 | 42,980 
25 18,940 | 20,867 | 24,337 | 28,172 | 30,675 | 34,382 | 37,652 | 41,566 | 44,314 
26 19,820 | 21,792 | 25,336 | 29,246 | 31,795 | 35,563 | 38,885 | 42,856 | 45,642 
27 20,703 | 22,719 | 26,336 | 30,319 | 32,912 | 36,741 | 40,113 | 44,140 | 46,963 
28 21,588 | 23,647 | 27,336 | 31,391 | 34,027 | 37,916 | 41,337 | 45,419 | 48,278 
29 22,475 | 24,577 | 28,336 | 32,461 | 35,139 | 39,087 | 42,557 | 46,693 | 49,588 
30 23,364 | 25,508 | 29,336 | 33,530 | 36,250 | 40,256 |. 43,773 | 47,962 | 50,892 


So Robbe 
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Tafel V. Die Studentsche t-Verteilung 


Die Tafel enthält die Werte von t, für einige Werte &. Dabei ist i, derart gewählt, daß die 
Wahrscheinlichkeit dafür, daß die Studentsche Zufallsvariable £ mit n Freiheitsgraden ab- 
solut genommen nicht kleiner als £, ist, gleich « ist: 


Pl 21) = — at 


0,80 0,60 0,40 0,20 | 0,10 0,05 0,02 0,01 


0,325 | 0,727 1,376 3,078 6,314 | 12,706 | 31,821 |. 63,657 
0,289 | 0,617 1,061 1,886 2,920 4,303 | 6,965 | 9,925 
0,277 | 0,584 | 0,978 1,638 2,353 3,182 | 4,541 5,841 
0271 0,569 | 0,941 1,533 2,132 2,776 | 3,747 | 4,604 
0,920 1,476 2,015 2,571 3,365 | 4,032 

0,265 | 0,553 ! 0,906 1,440 1,943 2,447 3,143 | 3,707 

0,263 | 0,549 | 0,896 1,415 1,895 2,365 | 2,998 3,499 

0,262 0,546 0,889 1,397 1,860 2,306 | 2,896 | 3,355 

0,261 0,543 | 0,883 1,383 1,833 2,262 | 2,821 3,250 
10! 0,260 | 0,542 0,879 1,372 1,812 2,228 2,764 | 3,169 
11 | 0,260 0,540 . | 0,876 1,363 1,796 2,201 2,718 | 3,106 
ı2 | 0,259 | 0,539 0,873 1 356 1,782 2,179 | 2,681 3,055 
13 | 0,259 | 0,538 | 0,870 1,350 1,771 2,160 | 2,650 | 3,012 
14 | 0,258 | 0,537 0,868 1,345 1,761 2,145 | 2,624 | 2,977 
15 | 0,258 | 0,536 0,866 | 1,341 1,753 2,131 2,602 | 2,947 
16 | 0,258 | 0,535 | 0,865 1,337 1,746 2,120 | 2,583 | 2,921 
17 | 0,257 | 0,534 | 0,863 1,333 1,740 2,110 | 2,567 | 2,898 
ı8 | 0,257 0,534 | 0,862 | 1,330 1,734 2,101 2,552 | 2,878. 
19 | 0,257 0,533 0,861 1,328 1,729 2,0938 | 2,539 | 2,861 
20.| 0,257 | 0,533 | 0,860 1,325 1,725 2,086 ı 2,528 | 2,845 
21 | 0,57 0,532 0,859 1,323 1,721 2,080 | 2518 | 2,831 
22 | 0256 | 0,532 | 0,858 1,321 1,717 2,074 | 2,508 2,819 
23 | 0,256 0,532 0,858 1,319 1,714 2,069 | 2,500 | 2,807 


so-.ıaurwmMm 
oO 
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3 
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24 0,256 0,531 0,857 1,318 1,711 2,064 2,492 2,797 
25 0,256 0,531 0,856 1,316 1,708 2,060 2,485 - 2,787 
26 0,256 0,531 0,856 1,315 1,706 2,056 2,479 2,779 


27 0,256 0,531 0,855 1,314 1,703 2,052 2,413 2,771 
28 0,256 0,530 0,855 |. 1,313 1,701 2,048 2,467 2,763 
29 0,256 0,530 0,854 1,311 1,699 2,045 2,462 2,756 
30 0,256 0,530 0,854 1,310 1,697 2,042 2,457 2,750 
40 0,255 0,529 0,851 1,303 ‘1,684 2,021 2,423 2,704 
60 0,254 0,527 |. 0,848 1,296 1,671 2,000 2,390 2,660 
120 0,254 0,526 0,845 1,289 1,658 1,980 2,358 2,617 
[6 e) 0,253 0,524 0,842 1,282 1,645 1,960 2,326 2,576 
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Tafel V1. Die Fishersche Z-Verteilung 
Die Tafel enthält die Werte von 2,, für die die Wahrscheinlichkeit dafür, daß die Fishersche 
Zufallsvariable Z mit (r,, r,) Freiheitsgraden nicht kleiner als z, ist, gleich 0,05 ist: 


Pı222)= [ fe) dz= 0,05, 
20 


hierbei ist f(z) durch die Formel (9.7.5) bestimmt. 


> 
w 


P 
ei 
m 
® 
m 
® 
F 
P 

8 


2,5421 | 2,6479 | 2,6870 | 2,7071 | 2,7194 | 2,7276 | 2,7380 | 2,7484 | 2,7588 | 2,7693 
1,4592 | 1,4722 | 1,4765 | 1,4787 | 1,4800 | 1,4808 | 1,4819 | 1,4830 | 1,4840 | 1,4851 
1,1577 | 1,1284 | 1,1137 | 1,1051 | 1,0994 | 1,0953 | 1,0899 | 1,0842 | 1,0781 | 1,0716 
1,0212 | 0,9690 | 0,9429 | 0,9272 | 0,9168 | 0,9093 | 0,8993 | 0,8885 | 0,8767 | 0,8639 
0,9441 | 0,8777 | 0,8441 | 0,8236 | 0,8097 | 0,7997 | 0,7862 | 0,7714 | 0,7550 | 0,7368 
0,8948 | 0,8188 | 0,7798 | 0,7558 | 0,7394 | 0,7274 | 0,7112 | 0,6531 | 0,6729 | 0,6499 
0,8606 | 0,7777 | 0,7347 | 0,7080 | 0,6896 | 0,6761 | 0,6576 | 0,6369 | 0,6134 | 0,5862 
0,8355 | 0,7475 | 0,7014 | 0,6725 | 0,6525 | 0,6378 | 0,6175 | 0,5945 | 0,5682 | 0,5371 
0,8163 | 0,7242 | 0,6757 | 0,6450 | 0,6238 | 0,6080 | 0,5862 | 0,5613 | 0,5324 | 0,4979 
10 | 0,8012 | 0,7058 | 0,6553 | 0,6232 | 0,6009 | 0,5843 | 0,5611 | 0,5346 | 0,5035 | 0,4657 
11 | 0,7889 | 0,6909 | 0,6387 | 0,6055 | 0,5822 | 0,5648 | 0,5406 | 0,5126 | 0,4795 | 0,4387 
12 | 0,7788 | 0,6786 | 0,6250 | 0,5907 | 0,5666 | 0,5487 | 0,5234 | 0.4941 | 0,4592 | 0,4156 
13 | 0,7703 | 0,6682 | 0,6134 | 0,5783 | 0,5535 | 0,5350 | 0,5089 | 0,4785 | 0,4419 | 0,3957 
14 | 0,7630 | 0,6594 | 0,6036 | 0,5677 | 0,5423 | 0,5233 | 0,4964 | 0,4649 | 0,4269 | 0,3782 
15 1|0,7568 | 0,6518 | 0,5950 | 0,5585 | 0,5326 | 0,5131 | 0,4855 | 0,4532 | 0,4138 | 0,3628 
16 | 0,7514 | 0,6451 | 0,5876 | 0,5505 | 0,5241 | 0,5042 | 0,4760 | 0,4428 | 0,4022 | 0,3490 
17 | 0,7466 | 0,6393 ) 0,5811 | 0,5434 | 0,5166 | 0,4964 | 0,4676 | 0,4337 | 0,3919 |-0,3366 
18 [0,7424 | 0,6341 | 0,5753 | 0,5371 | 0,5099 | 0,4894 | 0,4602 | 0,4255 | 0,3827 | 0,3253 
19 | 0,7386 | 0,6295 | 0,5701 | 0,5315 | 0,5040 | 0,4832 | 0,4535 | 0,4182 | 0,3743 | 0,3151 
20 |0,7352 | 0,6254 | 0,5654 | 0,5265 | 0,4986 | 0,4776 | 0,4474 | 0,4116 | 0,3668 | 0,3057 
21 0,7322 | 0,6216 | 0,5612 | 0,5219 | 0,4938 | 0,4725 | 0,4420 | 0,4055 | 0,3599 | 0,2971 
22 | 0,7294 | 0,6182 | 0,5574 | 0,5178 | 0,4894 | 0,4679 | 0,4370 | 0,4001 | 0,3536 | 0,2892 
23 1|0,7269 | 0,6151 | 0,5540 | 0,5140 | 0,4854 | 0,4636 | 0,4325 | 0,3950 | 0,3478 | 0,2818 
24 | 0,7246 [0,6123 | 0,5508 | 0,5106 | 0,4817 | 0,4598 | 0,4283 | 0,3904 | 0,3425 | 0,2749 
25 | 0,7225 | 0,6097 | 0,5478 | 0,5074 | 0,4783 | 0,4562 | 0,4244 | 0,3862 | 0,3376 | 0,2685 
26 | 0,7205 | 0,6073 | 0,5451 | 0,5045 | 0,4752 | 0,4529 | 0,4209 | 0,3823 | 0,3330 | 0,2625 
27 | 0,7187 | 0,6051 | 0,5427 | 0,5017 | 0,4723 | 0,4499 | 0,4176 | 0,3786 | 0,3287 | 0,2569 
28 | 0,7171 | 0,6030 | 0,5403 | 0,4992 | 0,4696 | 0,4471 | 0,4146 | 0,3752 | 0,3248 | 0,2516 
29 0,7155 | 0,6011 | 0,5382 | 0,4969 | 0,4671 | 0,4444 | 0,4117 | 0,3720 | 0,3211 | 0,2466 
30 | 0,7141 | 0,5994 | 0,5362 | 0,4947 | 0.4648 | 0,4420 | 0,4090 | 0,3691 | 0,3176 | 0,2419 
40 | 0,7037 | 0,5866 | 0,5217 | 0,4789 | 0,4479 | 0,4242 | 0,3897 | 0,3475 | 0,2920 | 0,2057 
60 | 0,6933 | 0,5738 | 0,5073 | 0,4632 | 0,4311 | 0,4064 | 0,3702 | 0,3255 | 0,2654 | 0,1644 
120 | 0,6830 | 0,5611 | 0,4930 | 0,4475 | 0,4143 | 0,3885 | 0,3506 | 0,3032 | 0,2376 | 0,1131 
[= 0,6729 | 0,5486 | 0,4787 | 0,4319 | 0,3974 | 0,3706 | 0,3309 | 0,2804 | 0,2085 | 0,0000 


osoı1ou pw 
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Tafel VII. Die Fishersche Z-Verteilung 


Die Tafel enthält die Werte von 2, für die die Wahrscheinlichkeit lafür, daß die Fishersche 
Zufallsvariable Z mit (r,, r,) Freiheitsgraden nicht kleiner als 2, ist, gleich 0,01 ist. 


P(2 > x) = [re dz = 0,01, 


2% 


hierbei ist /(z) durch die Formel (9.7.5) bestimmt. 
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Tafel VIII. Die Kolmogoroff-Smirnowsche A-Verteilung 
Die Tafel gibt Werte der Funktion Q(A) an, die durch die Formel 


aM = FE (Nr 


bestimmt ist. 


» | om 


0,32 
0,33 
0,34 
0,35 
0,36 
0,37 
0,38 
0,39 
0,40 


0,41 


0,42 
0,43 
0,44 
0,45 
0,46 
0,47 
0,48 
0,49 
0,50 
0,51 
0,52 


0,53 


0,54 
0,55 
0,56 
0,57 
0,58 
0,59 
0,60 
0,61 
0,62 
0,63 
0,64 
0,85 


0,0000 
0,0001 
0,0002 
0,0003 
0,0005 
0,0008 
0,0013 
0,0019 
0,0028 
0,0040 
0,0055 
0,0074 
0,0097 
0,0126 
0,0160 
0,0200 
0,0247 
0,0300 
0,0361 
0,0428 
0,0503 
0,0585 
0,0675 


0,0772. 


0,0876 
0,0987 
0,1104 
0,1228 
0,1357 
0,1492 
0,1632 
0,1778 
0,1927 
0,2080 


k=- © 


0,2236 
0,2396 
0,2558 
0,2722 
0,2888 
0,3055 
0,3223 
0,3391 
0,3560 
0,3728 
0,3896 
0,4064 
0,4230 
0,4395 
0,4559 
0,4720 
0,4880 
0,5038 
0,5194 
0,5347 
0,5497 
0,5645 
0,5791 
0,5933 
0,6073 
0,6209 
0,6343 
0,6473 
0,6601 
0,6725 
0,6846 
0,6964 
0,7079 


|o,r191 


RR 


1,10 
1,11 
1,12 
1,18 
1,14 
1,15 
1,16 
1,17 
1,18 
1,19 
1,20 
1,21 
1,22 
1,23 
1,24 
1,25 
1,26 
1,27 
1,28 
1,29 
1,30 
1,31 
1,32 
1,33 
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